Раньше индустрия полагалась на увеличение числа параметров в моделях для улучшения качества. Но Alibaba демонстрирует другую стратегию: больше интеллекта — меньше вычислений.
Команда Qwen выпустила серию моделей с размерами от 0.8 миллиарда до 9 миллиардов параметров. Главный акцент — достижение высокого уровня reasoning и multimodal возможностей без нагрузки на аппаратное обеспечение.
Модели 0.8B и 2B идеально подходят для edge-устройств и IoT, требуют минимальной VRAM и обеспечивают быструюInference. Примеры — модели Qwen 3.5-0.8B и 2B.
Модели 4B и выше уже обладают встроенной multimodal функциональностью, обрабатывая визуальные и текстовые данные внутри одной системы. Это делает их более мощными для задач UI навигации и анализа документов.
Лиднозой — модель 9B, которую улучшили с помощью Scaled Reinforcement Learning, что помогает моделям лучше reasoning и снижает hallucinations, делая выводы быстрее и надежнее.
Общий тренд — смещение фокуса с просто параметров и масштабов к оптимизации архитектуры и обучающих методов, чтобы добиться лучшей производительности на малых устройствах.
В будущем ожидается, что модели продолжат развиваться в сторону более эффективных multimodal технологий, позволяющих запускать мощный ИИ прямо на смартфонах и встраиваемых системах, минимизируя потребность в облаке.
