Введение в проблему
Современные задачи планирования для роботов становятся все более сложными и разнообразными. Система, разработанная исследователями MIT, предлагает новое решение для этих вызовов, улучшая навигацию в меняющихся условиях или повышая эффективность многоагентных систем.

Гибридный подход к планированию
Система основана на генеративном искусственном интеллекте, который фиксирует сценарии на изображениях и симулирует необходимые действия для достижения цели. Дальнейшая обработка результатов позволяет получить подробный план действий, который можно применить в реальных условиях.
Двухступенчатая система
Процесс начинается с использования модели, которая воспринимает изображение и симулирует шаги к цели. Затем вторая модель переводит эти симуляции в программный язык, подходящий для планирования. Это позволяет системе генерировать планы с успехом около 70%, что значительно превосходит существующие методы, которые достигают только 30%.
Преимущества и новизна подхода
Система может решать новые задачи, с которыми она ранее не сталкивалась, что делает ее особенно полезной для реальных условий, где ситуация может быстро измениться. Например, в случае аварийной ситуации в автономной навигации, система сможет быстро адаптироваться и предложить новый безопасный маршрут.
Интеграция с формальными решателями
Важной частью системы является использование мощных возможностей формальных решателей, которые обрабатывают стандартные программные языки для планирования. Эти решатели работают с файлами, сгенерированными системой, обеспечивая точность и надежность планов выполнения задач.

Гибкость и адаптивность
Система VLMFP (Visual Language Model Guided Formal Planning) создает два файла на языке PDDL (Planning Domain Definition Language): файл домена и файл задачи. Это позволяет ей решать задачи в разных контекстах, оставаясь гибкой и адаптивной. Система продемонстрировала успешность в 60% случаев на 2D задачах и более 80% на 3D задачах, таких как совместная работа роботов.
Будущее визуального планирования
Исследователи планируют расширить возможности системы для более сложных задач и изучить методы устранения ошибок в моделях VLM. Это может стать важным шагом на пути к созданию еще более надежных и интеллектуальных систем в будущем.
Таким образом, этот подход открывает новые горизонты для робототехники и других областей, где требуется высокоточное планирование в изменяющихся условиях.