Новое исследование Стэнфордского университета показало, что автономные ИИ-агенты способны выполнять рутинные задания быстрее и дешевле специалистов, но уступают в сложных сценариях.
Учёные протестировали пять популярных агентов — Auto-GPT, BabyAGI, AgentGPT, GPT-Engineer и MetaGPT — на выполнении унифицированного набора задач и сравнили их результаты с работой 250 фрилансеров. ИИ-агенты продемонстрировали более высокую скорость и меньшие затраты, однако по качеству итоговых решений они не смогли обойти людей.
«Несмотря на впечатляющие успехи в автоматизации простых операций, современные агенты пока не способны полностью заменить специалистов в нестандартных и творческих задачах», — отмечает руководитель проекта в Стэнфорде.
Например, в заданиях, требующих адаптации к неожиданным изменениям или глубокой предметной экспертизе, люди сохраняли преимущество. Эксперты в области ИИ считают, что дальнейшее развитие архитектур агентов и интеграция человеческого контроля помогут расширить сферу их применения.
По прогнозам аналитиков, в ближайшие годы ИИ-агенты всё шире внедрят в бизнес-процессы для рутинных операций, а сложные задачи по-прежнему будут оставаться за человеком.



