На этой неделе в мире искусственного интеллекта произошло сразу несколько значимых событий. Anthropic и OpenAI почти одновременно выпустили свои новые модели: Claude Opus 4.6 и GPT-5.3 Codex. Эти обновления принесли существенные улучшения в производительности и функциональности, особенно в области кодинга и долгосрочных задач.
Новые достижения в производительности
Модели Opus 4.6 и Codex 5.3 продемонстрировали впечатляющие результаты в тестах. Так, на Terminal-Bench 2.0, который оценивает навыки работы агентов, Codex 5.3 набрал 77.3%, значительно превзойдя предыдущую версию и конкурента Opus 4.6 с 65.4%. В то же время, в тестах на использование компьютера Opus 4.6 показал результат 72.7% против 64.7% у Codex 5.3.
Эволюция и новые возможности
Opus 4.6 получил новые функции, такие как адаптивное мышление и возможность работы с контекстом до 1 миллиона токенов. Это делает его более универсальным для использования в различных задачах, от исследований до финансов. Codex 5.3, в свою очередь, был оптимизирован для более эффективного использования токенов, что значительно ускоряет выполнение задач.
Стратегический поворот в сторону универсальности
Обе компании делают шаги в сторону создания универсальных агентов. Codex 5.3 теперь направлен не только на кодинг, но и на анализ данных и мониторинг развёртывания. Антропик также развивает свои модели, чтобы они могли использоваться в офисных приложениях, таких как PowerPoint и Excel.
Реальные примеры и будущее агентной работы
Недавний проект по созданию компилятора с использованием 16 параллельных агентов Claude показал, что AI может выполнять сложные задачи, ранее доступные только людям. Это открывает новые возможности для автоматизации и оптимизации процессов в различных сферах.
Планы Waymo и интеграция с Genie 3
Компания Waymo объявила о внедрении модели Genie 3 от Google DeepMind в свою систему автономного вождения. Это позволит создавать более реалистичные тренировки для беспилотных автомобилей, включая редкие и экстремальные условия.
Эти обновления показывают, что гонка за создание наиболее продвинутых AI-агентов продолжается, и каждая новая версия моделей приближает нас к более интеллектуальным и автономным системам.
