В индустрии давно винила потребность в системах, способных управлять множеством тесно связанных задач — что сейчас называется Multi-Horizon Task Environments или MHTEs. Ранее большинство решений просто фокусировались на отдельных задачах, игнорируя сложность реального мира, — рассказывает источник. Но в реальности организации сталкиваются с десятками, а иногда и сотнями зависимых задач, требующих одновременного внимания, и это сказывается на эффективности систем.
На практике стандартные агенты-помощники (CUAs) показывали слабый результат: при нагрузке в 25% их эффективность падала до 16.7%, а при полном — до 8.7%. Причины — контекстное насыщение, помехи в памяти, сложная карта зависимостей и проблемы с пере приоритетизацией задач. Именно это и подтолкнуло Microsoft к разработке CORPGEN — системы, которая пытается решить проблему с помощью четырёх ключевых архитектурных решений:
- иерархического планирования с декомпозицией целей по стратегическому, тактическому и операционному уровням;
- модульных суб-агентов, изолированных в своих контекстах, чтобы избежать загрязнения памяти;
- многоуровневой системы памяти: рабочей, структурированной долгосрочной и семантической с embedding'ами;
- адаптивной сводки — правило-базируемого сжатия, сохраняющего важную информацию, одновременно сокращая объём данных для постоянной обработки.
Эксперименты показывают впечатляющие результаты. При использовании трёх движков — UFO2, OpenAI, и иерархического — производительность повысилась в 3,5 раза — с 4.3% до 15.2% успешных завершений при полном гипере. Основной вклад — опытное обучение, превращающее успешные траектории в базу данных и поиск по ней для минимизации ошибок. Кроме того, авторы отмечают, что 90% оценки по артефактам согласуются с мнением человека, тогда как trace-оценка — только на 40%, что может означать недооценку реальной эффективности таких систем в benchmarking.
Что дальше? Всё указывает на развитие идей многоуровневого планирования, расширение памяти и автоматической сводки. В ближайшие кварталы мы увидим, как эти принципы войдут в стандартные платформы. Те команды, что начнут внедрять CORPGEN сегодня, получат преимущество в создании более устойчивых и интеллектуальных агентских систем — ведь положительный эффект в управлении сложностью процессов очевиден.
