OpenAI представляет GPT-5.4: шаг к автономному ИИ
На этой неделе OpenAI анонсировала новый GPT-5.4, модель, направленную на оптимизацию профессиональной работы. Впервые он стал доступен в ChatGPT, API и Codex, а также в версии Pro для сложных задач. GPT-5.4 объединяет достижения OpenAI в области логики, кодирования и использования агентов в одной модели, адаптируя силу кодирования GPT-5.3-Codex и улучшая использование инструментов в программных средах и задачах, связанных со знанием.
В ChatGPT, GPT-5.4 Thinking может предложить план работы, который пользователь может корректировать в процессе. В API и Codex модель поддерживает до 1 миллиона токенов контекста для более долгосрочных задач, что делает её первой общей моделью OpenAI с такими возможностями. Модель также предлагает улучшенную эффективность использования токенов по сравнению с GPT-5.2.
Достижения в области производительности
На тестах GPT-5.4 показала 83.0% на GDPval, 75.0% на OSWorld-Verified и 82.7% на BrowseComp. Эти результаты говорят о значительном улучшении по сравнению с предыдущими моделями и подчеркивают ориентацию на рабочие процессы.
Самоулучшение ИИ: эксперимент Карпати
Ещё одна важная новость этой недели — эксперимент Андрея Карпати с автоисследованием. Карпати показал, что агенты ИИ могут самостоятельно находить улучшения в обучении нейронных сетей. Этот процесс включает в себя автоматическую настройку параметров, редактирование кода и тестирование на малых масштабах, что уже является ценным исследовательским процессом.
Ожидается, что лаборатории будут выделять значительные ресурсы для агентных систем, чтобы те могли проводить множество экспериментов на малых моделях. Это позволит найти более эффективные механизмы внимания и рецепты данных, которые затем можно будет масштабировать.
Почему это важно?
Эволюция от "умного чат-бота" к "надежному оператору" меняет центр тяжести в ИИ. Модель, способная решать сложные задачи и использовать инструменты, становится более востребованной, чем просто выдающая красивые ответы. GPT-5.4 и другие новинки показывают путь к более продуктивному ИИ, который может заменить знания работников на четко определённых задачах.
