Улучшение способности ИИ к сложным рассуждениям может стать возможным благодаря новой исследовательской работе, проведённой в Массачусетском технологическом институте. Учёные предложили новый подход к обучению больших языковых моделей, позволяющий им лучше справляться с многоэтапными логическими задачами.
Один из ключевых выводов исследования — важность подбора правильного обучающего сигнала для формирования более точных рассуждений. Команда исследователей протестировала несколько подходов и пришла к выводу, что качество рассуждений у языковых моделей можно значительно улучшить, если они получают обратную связь не только по итоговому ответу, но и по промежуточным шагам мышления.
Исследователи сосредоточились на том, как модели строят цепочки логических умозаключений. Традиционно языковые модели обучаются на больших массивах текстов и формируют ответы, ориентируясь на финальный результат. Однако новый подход предполагает обучение модели также на правильности каждого логического перехода внутри решения.
Один из авторов проекта отметил: «Мы считаем, что языковые модели нуждаются не просто в примерах решений, а в структуре, помогающей отслеживать последовательность рассуждений. Это особенно важно для задач, требующих комплексного мышления».
Для проверки гипотезы были использованы специальные тесты на логическое и математическое мышление, включая задачи по математике средней сложности. Модели, обученные с промежуточной обратной связью, показали лучшую точность и устойчивость в ответах по сравнению с традиционно обученными.
Авторы считают, что такие методы могут стать основой для следующего поколения языковых моделей, более уверенно решающих сложные задачи — от программирования до научного анализа. Работа также открывает новые перспективы для создания ИИ, способного объяснять свои решения пользователям, что особенно важно в образовательных и медицинских системах.
