В последнее время на выставках и презентациях агентные AI-системы выглядят чудесно: идеи, инструменты, инструменты, быстрые реакции. Однако в реальных условиях такие системы часто оказываются ненадежными и сталкиваются с множеством проблем. Исходный документ от ученых Стэнфорда, Гарварда, UC Berkeley и Caltech предлагает структурированный подход к адаптации агентных систем. Основная идея — модель агента объединена с тремя ключевыми модулями: планировщиком, модулем использования инструментов и памятью, которая сохраняет краткосрочные и долгосрочные знания.
Авторы выделяют два уровня адаптации: к системе в целом и к инструментам. Первая — обучение по реакции на отзывы или результатам выполнения задач, например, через супервайз или усиленное обучение. Вторая — настройка самих инструментов, что помогает повысить их повторное использование независимо от агента или под руководством фиксированной модели. Эти парадигмы помогают объяснить, почему в демонстрациях всё гладко, а в реальности — проблемы с надежностью и масштабируемостью.
Главный посыл — необходимость сочетания редких обновлений A1 или A2 с частыми тренировками T1 и T2 для повышения стабильности. В статье приводятся примеры систем типа s3 и AgentFlow, использующие подобные схемы. Важный вывод: для повышения эффективности и масштабируемости агентных систем следует превращать обучение не только из самого агента, но и из его инструментов и памяти. В будущем ожидается интеграция этих методов для создания более надежных и адаптивных ИИ.
