От умного чат-бота к надежному сотруднику: что нового в GPT-5.4
Индустрия искусственного интеллекта переживает важный сдвиг. На этой неделе компания OpenAI представила GPT-5.4 — свою самую продвинутую модель, заточенную под профессиональную работу. Это уже не просто генератор красивых текстов, а полноценный цифровой оператор.
Новая модель объединяет в себе выдающиеся навыки программирования и способность напрямую взаимодействовать с интерфейсом компьютера. Теперь ИИ может самостоятельно «кликать» по экрану, искать нужные инструменты и работать с огромным объемом данных — контекстное окно расширили до 1 миллиона токенов. Это значит, что нейросеть способна держать в памяти целые книги или массивы корпоративной документации.
Среди главных фишек GPT-5.4 — возможность корректировать работу ИИ прямо в процессе. Если вы видите, что модель пошла не по тому пути, вам не нужно прерывать задачу и начинать заново. Вы можете просто направить ее в нужное русло. В тестах на выполнение реальных офисных задач (бенчмарк GDPval) новинка набрала 83%, что является колоссальным скачком по сравнению с предыдущими версиями.
ИИ начинает улучшать сам себя: прорыв Андрея Карпати
Второе, и возможно, самое важное событие недели — результаты эксперимента известного ИИ-исследователя Андрея Карпати. Он на практике показал, что нейросети могут автономно находить способы улучшить собственное обучение. Этот процесс назвали автоисследованием (autoresearch).
Карпати создал для ИИ-агента небольшую тренировочную среду и оставил его работать на пару дней. Нейросеть сама писала код, проводила короткие тесты, проверяла результаты и повторяла цикл. В итоге ИИ нашел около 20 удачных изменений, которые ускорили обучение модели на 11%.
Многие могут сказать, что это просто автоматический подбор параметров. Но экономический смысл этого открытия огромен. Если рой ИИ-агентов может круглосуточно тестировать сотни гипотез на дешевых серверах, а затем передавать лучшие решения людям для масштабирования, скорость развития технологий возрастет многократно.
Битва за офисные задачи: Microsoft Copilot против всех
Пока OpenAI улучшает свои базовые модели, Microsoft делает ставку на интеграцию. Компания объявила о внедрении технологий агентов Claude Cowork в свой сервис Microsoft 365 Copilot. Это дает им огромное преимущество в распространении.
Большая часть офисной работы в мире уже происходит в Word, Excel и Teams. Microsoft предлагает корпоративную безопасность и готовые инструменты. Однако эксперты отмечают, что OpenAI и Anthropic пока лучше понимают, как сделать продукт, которым людям действительно хочется пользоваться. Гонка за право стать главным корпоративным ИИ-помощником только начинается.
Google Gemini 3.1 Flash-Lite: скорость под контролем
Не отстает и Google, представившая Gemini 3.1 Flash-Lite. Это максимально экономичная и быстрая модель, созданная для задач, где важна минимальная задержка. Главное нововведение — разработчики теперь могут программно настраивать «уровень раздумий» нейросети.
- Минимальный или низкий уровень: для мгновенных ответов и простых задач.
- Средний или высокий уровень: для сложных аналитических вычислений, требующих времени.
Это позволяет бизнесу гибко управлять балансом между скоростью работы ИИ и стоимостью вычислений.
Почему это важно для индустрии ИИ?
Центр тяжести в ИИ-разработке окончательно сместился. Побеждает больше не та система, которая пишет лучшие стихи, а та, которая может час не сбиваться с задачи, использовать нужные программы и не тратить лишние вычислительные ресурсы. Мы видим переход к надежным операторам.
Кроме того, мы стоим на пороге эры замкнутого цикла улучшений. В ближайший год ведущие лаборатории выделят ИИ-агентам огромные вычислительные мощности просто для того, чтобы те искали новые архитектурные решения. Люди-исследователи станут скорее архитекторами и судьями, а рутинную работу по проверке тысяч гипотез возьмет на себя сам искусственный интеллект. Будущее наступает быстрее, чем мы ожидали.
