EnCompass, новая система, разработанная исследователями из MIT CSAIL и компании Asari AI, предлагает инновационный подход к работе с ИИ-агентами, использующими большие языковые модели (LLM). Эта разработка позволяет агентам автоматически возвращаться к предыдущим шагам и делать несколько попыток, чтобы найти наилучшее решение.
Как работает EnCompass
Когда программа запускается с помощью EnCompass, она автоматически возвращается назад, если LLM допускает ошибки. Также система может создавать клоны выполнения программы, что позволяет делать параллельные попытки поиска лучших решений.
Это особенно полезно для программистов, работающих с ИИ-агентами, так как позволяет сократить время и усилия, затрачиваемые на исправление ошибок LLM вручную.
Преимущества для программистов
Используя EnCompass, программисты могут аннотировать те места в коде, где возможны ошибки, и задавать стратегию поиска оптимального решения. Это позволяет легко экспериментировать с различными методами поиска и находить наиболее подходящую стратегию для выполнения задач.
Система уже показала свою эффективность в проектах по переводу кодов и разработке сложных алгоритмов, снижая объем кода на 80%.
Влияние на будущее ИИ
По мере того как ИИ становится неотъемлемой частью программного обеспечения, важно разрабатывать инструменты, которые позволяют максимизировать его возможности. EnCompass предлагает структурированный подход к улучшению генерации и анализа кода, что может существенно повлиять на индустрию разработки программного обеспечения.
В будущем EnCompass может быть использован для решения более сложных задач, таких как управление большими библиотеками кода или проектирование сложных систем, включая ракеты и другие инженерные сооружения.
Эта работа была представлена на конференции по нейронным информационным системам (NeurIPS) и получила высокую оценку экспертов в области ИИ и программирования.
