Индустрия ИИ снова на грани перемен: Alibaba раскрыл свою новинку — Qwen3-Max-Thinking, модель, которая не только масштабирует параметры, но и выводит рассуждения на новый уровень, позволяя управлять глубиной мышления и интегрировать инструменты поиска, памяти и выполнения кода.
Созданная как топовая система в семействе Qwen3, модель обладает триллионными весами и была обучена на 36 триллионах токенов. Особенно она хорошо справляется с долгосрочным рассуждением и работой с кодом, а её контекстное окно достигает 262 тысячи токенов — это как анализировать гипербольшой массив данных в одном отклике.
Что делает модель уникальной?
- Использует опытный подход, повторно задействуя промежуточные выводы — стратегия, которая повышает точность без увеличения затрат токенов
- Обладает функциями нативных инструментов: поиск, память и интерпретатор кода — все в одном кортеже, что уменьшает вероятность ошибок и галлюцинаций
- Работает через API, поскольку веса не доступны публично; акцент сделан на высокую эффективность и тестовую масштабируемость
Какие результаты и будущие возможности?
Модель показывает отличные показатели на различных benchmark''ах: 82.1 в Tau² Bench, близка к GPT 5.2 Thinking, показывает 93.7 в C-Eval и лидирует по математическим и научным задачам. В кодировании — 85.9 на LiveCodeBench, что превосходит многие за счёт встроенных инструментов и адаптивного использования ресурсов.
Экспертные оценки показывают, что внедрение опыта за счёт повторного использования промежуточных выводов позволяет сокращать вычислительные ресурсы и повышать точность. В будущем ожидается расширение возможностей нативных инструментов и более аккуратное управление рассуждениями в реальных сценариях терапии, программирования и научных исследований.
На ближайшие месяцы индустрия ожидает переход к более эффективным стратегиям масштабирования и интеграции новых модулей, а те, кто быстро интегрируют такие подходы, получат конкурентное преимущество. Эта модель показывает, что следующее поколение ИИ — это управляемое с помощью тестовых масштабов и встроенных инструментов искусственный разум.
