Мировая индустрия ИИ столкнулась с новым прорывом: Microsoft Research создала OptiMind, систему, которая способна превращать описание сложных задач в математические модели для оптимизаторов. Эта разработка решает давнюю проблему — как быстро и без ошибок переводить бизнес-цели в формулы, понятные автоматическим решателям, таких как MILP.
OptiMind — это трансформер с 20 миллиардами параметров, основанный на модели Mixture of Experts, который активирует порядка 3.6 миллиарда параметров при обработке одного токена. Модель поддерживает длинный контекст до 128 тысяч токенов, что позволяет ей справляться с объемными спецификациями и многопроходным reasoning внутри одной запроса.
Инновационный подход к обучению и применению
Разработчики используют очищенные датасеты, такие как OR Instruct и OptMATH Train, для обучения модели, а тестовые — проверены экспертами и включают сложные задачи, где обычно точность лишь 20-50% у существующих систем. Важной частью был освоенный системный подход к очистке данных и созданию подсказок, которые помогают избегать распространенных ошибок.
Как работает OptiMind
В ходе inference модель проходит несколько этапов: классификация задачи из 53 возможных типов, дополнение подсказками, специфичными для каждого типа, генерация математической формулы и кода на Python. Техники, применяемые для повышения точности — self-consistency, голосование кандидатов и режим многопроходной коррекции — помогают снизить число ошибок.
Результаты показывают рост точности на проверочных данных на 20.7% после дообучения, а применение масштабирования при тестировании увеличивает показатели до уровня, сравнимого с GPT-4 и GPT-5. Важный аспект — системная очистка данных значительно повышает результативность: от 40% до 70–90% точности в зависимости от чистоты данных.
Что дальше
Сейчас индустрия движется от попыток быстрого внедрения RAG к пониманию важности правильной настройки данных и тайных подсказок. В ближайшие месяцы ожидается стабилизация подходов, когда модели смогут автоматически классифицировать задачи, генерировать точные формулы и интегрироваться в системы поддержки принятия решений для логистики и производства.
OptiMind показывает, что сочетание экспертизы, очистки и систематического подхода делает технологию действительно практичной — это не просто эксперимент, а прототип для реальных решений, которые можно внедрять в бизнес.
Владельцы решений уже понимают: чтобы добиться успеха, нужно учиться не только архитектуре моделей, но и подготовке данных и алгоритмам самоулучшения, ведь именно это определит их конкурентное преимущество.
