AI2 представила SERA — серию открытого кода, которая меняет подход к созданию кодинг-агентов. Вместо сложных методов RL или тестов, в основе — обучение под контролем с реалистичными траекториями разработчиков. Впервые в отрасли, эта методика снижает затраты и увеличивает масштаб.
Что такое SERA и почему это важно
SERA — это семейство моделей, построенных на архитектуре Qwen 3 32B, и обученных с помощью метода Soft Verified Generation (SVG), который использует симуляцию реальных workflow. Модели достигли 49,5% решенных задач на benchmarks SWE при длине контекста 32К и 54,2% при 64К — показатели, сопоставимые с крупными закрытыми моделями, такими как Devstral-Small-2 и GLM-4.5 Air, хотя SERA — полностью открытая по коду и данным.
Работы основаны на 200 тысячах траекторий из 121 репозитория Python, что делает их одними из крупнейших публичных баз данных для обучения кодирующих моделей. Обучение обходится примерно в 40 GPU-дней, что в 26 раз дешевле RL и почти в 57 раз — чем старые методы, использующие синтетические датасеты и тестовые пайплайны.
Что нового в подходе SVG
SVG — это генерация траекторий с помощью модельного учителя, сравнение их между собой и вычисление мягкого сигнала корректности. Даже с низкими или нулевыми оценками верификации модель показывает высокие результаты, что опровергает привычную догму о необходимости строгих тестов.
Это позволяет масштабировать обучение кодеров на огромных открытых репозиториях без затрат на ручную разметку или сложные системы тестов. На практике это уже проверяют для проектов как Django, SymPy и Sphinx — обучая модели на 46-54 тысячах траекторий, которых они успешно дообучают под конкретные задачи.
Перспективы и вызовы
Разработчики отмечают, что SERA открывает новое окно — код с минимальными затратами дорогостоящего RL, реалистичная подготовка данных и масштабируемость. Пока что остаются вопросы о том, как правильно адаптировать их к новым репозиториям и как обеспечить высокую точность в сложных сценариях.
В ближайшие 6-12 месяцев ожидается активный рост числа подобных моделей и бум исследований по SVG. Тех, кто освоится быстро, ждёт существенный прирост эффективности и снижения стоимости. Индустрия движется к тому, чтобы крупные open-source решения не уступали закрытым, а иногда даже превосходили их благодаря богатству данных и простоте настройки.
Если вы планируете свой кодовый проект, принимайте как данность, что подходы меняются: здесь уже не нужен сложный RL или тестовая инфраструктура — важнее масштаб данных и реализм тренировочных сценариев.

