GPT-5.4 и ИИ-саморазвитие: революция автономных агентов

От умного чат-бота к надежному сотруднику: что нового в GPT-5.4

Индустрия искусственного интеллекта переживает важный сдвиг. На этой неделе компания OpenAI представила GPT-5.4 — свою самую продвинутую модель, заточенную под профессиональную работу. Это уже не просто генератор красивых текстов, а полноценный цифровой оператор.

Новая модель объединяет в себе выдающиеся навыки программирования и способность напрямую взаимодействовать с интерфейсом компьютера. Теперь ИИ может самостоятельно «кликать» по экрану, искать нужные инструменты и работать с огромным объемом данных — контекстное окно расширили до 1 миллиона токенов. Это значит, что нейросеть способна держать в памяти целые книги или массивы корпоративной документации.

Среди главных фишек GPT-5.4 — возможность корректировать работу ИИ прямо в процессе. Если вы видите, что модель пошла не по тому пути, вам не нужно прерывать задачу и начинать заново. Вы можете просто направить ее в нужное русло. В тестах на выполнение реальных офисных задач (бенчмарк GDPval) новинка набрала 83%, что является колоссальным скачком по сравнению с предыдущими версиями.

ИИ начинает улучшать сам себя: прорыв Андрея Карпати

Второе, и возможно, самое важное событие недели — результаты эксперимента известного ИИ-исследователя Андрея Карпати. Он на практике показал, что нейросети могут автономно находить способы улучшить собственное обучение. Этот процесс назвали автоисследованием (autoresearch).

Карпати создал для ИИ-агента небольшую тренировочную среду и оставил его работать на пару дней. Нейросеть сама писала код, проводила короткие тесты, проверяла результаты и повторяла цикл. В итоге ИИ нашел около 20 удачных изменений, которые ускорили обучение модели на 11%.

Многие могут сказать, что это просто автоматический подбор параметров. Но экономический смысл этого открытия огромен. Если рой ИИ-агентов может круглосуточно тестировать сотни гипотез на дешевых серверах, а затем передавать лучшие решения людям для масштабирования, скорость развития технологий возрастет многократно.

Битва за офисные задачи: Microsoft Copilot против всех

Пока OpenAI улучшает свои базовые модели, Microsoft делает ставку на интеграцию. Компания объявила о внедрении технологий агентов Claude Cowork в свой сервис Microsoft 365 Copilot. Это дает им огромное преимущество в распространении.

Большая часть офисной работы в мире уже происходит в Word, Excel и Teams. Microsoft предлагает корпоративную безопасность и готовые инструменты. Однако эксперты отмечают, что OpenAI и Anthropic пока лучше понимают, как сделать продукт, которым людям действительно хочется пользоваться. Гонка за право стать главным корпоративным ИИ-помощником только начинается.

Google Gemini 3.1 Flash-Lite: скорость под контролем

Не отстает и Google, представившая Gemini 3.1 Flash-Lite. Это максимально экономичная и быстрая модель, созданная для задач, где важна минимальная задержка. Главное нововведение — разработчики теперь могут программно настраивать «уровень раздумий» нейросети.

Минимальный или низкий уровень: для мгновенных ответов и простых задач.
Средний или высокий уровень: для сложных аналитических вычислений, требующих времени.

Это позволяет бизнесу гибко управлять балансом между скоростью работы ИИ и стоимостью вычислений.

Почему это важно для индустрии ИИ?

Центр тяжести в ИИ-разработке окончательно сместился. Побеждает больше не та система, которая пишет лучшие стихи, а та, которая может час не сбиваться с задачи, использовать нужные программы и не тратить лишние вычислительные ресурсы. Мы видим переход к надежным операторам.

Кроме того, мы стоим на пороге эры замкнутого цикла улучшений. В ближайший год ведущие лаборатории выделят ИИ-агентам огромные вычислительные мощности просто для того, чтобы те искали новые архитектурные решения. Люди-исследователи станут скорее архитекторами и судьями, а рутинную работу по проверке тысяч гипотез возьмет на себя сам искусственный интеллект. Будущее наступает быстрее, чем мы ожидали.

Релиз GPT-5.4 и нейросети, которые улучшают сами себя: новая эра автономного ИИ

От умного чат-бота к надежному сотруднику: что нового в GPT-5.4

ИИ начинает улучшать сам себя: прорыв Андрея Карпати

Битва за офисные задачи: Microsoft Copilot против всех

Google Gemini 3.1 Flash-Lite: скорость под контролем

Почему это важно для индустрии ИИ?

Новости new