В индустрии ИИ снова случился поворот — MBZUAI анонсировала выпуск K2 Think V2, модели, способной выполнять сложные рассуждения в области математики, программирования и науки. Ранее считавшаяся фантастикой, идея о полностью прозрачной, управляемой системе оказалась ближе, чем казалось.
Новинка основана на 70-миллиардной модели K2 V2 Instruct, которая прошла тщательное обучение с применением усовершенствованных методов RLVR, сохраняя прозрачность веса и исходных данных. Модель состоит из 80 слоёв, с размером скрытого слоя в 8192 и 64 головами внимания.
Обучение происходило в три этапа — от классического предобучения на миллиардных корпусах, до расширения контекста до 512 тысяч токенов и финальной донастройки на спецданных. Такой подход позволил достигнуть удивительных результатов: 90% правильных решений на задачах типа AIME и HMMT, превосходя многие современные аналоги.
Особое внимание уделялось безопасности и открытости. MBZUAI заявила о высоком уровне снижения риска галлюцинаций и опасных выходных данных, а также опубликовала всеесающая документацию и веса модели — что делает их одним из немногих открытых крупных проектов в этом сегменте.
Промышленный и академический интерес к K2 Think V2 растёт. Чем больше технологических вызовов — тем более очевидно, что вектор долгосрочного рассуждения и прозрачное управление моделями становятся ключом к реальному внедрению этих технологий. В ближайшее время ожидается рост числа решений, базирующихся на таких принципах, и постепенное вытеснение закрытых систем, где скрыта внутренняя логика.
Если удастся сохранить баланс между мощностью, безопасностью и открытостью — модели вроде K2 Think V2 могут стать стандартом в следующем десятилетии.
