Испытания ChatGPT Agent: только один успешный результат из восьми

Поклонники ChatGPT ждали, что новый агент превратит разговорный ИИ в полноценного ассистента. Но недавние испытания показали: из восьми заданий лишь одно было выполнено почти безупречно. Именно так выглядят первые шаги к автономному помощнику — легко вдохновляют и не без подвохов.

Тесты включали разнообразные задачи — от анализа данных и преобразования файлов до сбора веб‑информации. В семи случаях агент допускал неточности, выдавая «альтернативные факты» вместо корректных результатов. Казалось, роботу не хватает надёжности, чтобы доверять ему сложные сценарии без контроля человека. А вы готовы полагаться на ИИ, который так склонен к выдумкам?

Эксперты отмечают: перспективы у ChatGPT Agent есть, но разработчикам стоит усилить механизмы проверки и фильтрации. Пока что автономный помощник требует человеческой «страховки» на каждом этапе. И всё же это лишь начало пути к умным агентам, которые могут взять на себя рутинное и оставить человеку творчество.

24 июля 2025, 14:19

Новости индустрии ИИ

Испытания ChatGPT Agent: только один успешный результат из восьми

Связанные ИИ

Новости new