IntellectNews
IntellectNews
    IntellectNews
    • Анализ изображений
    • Бизнес-исследования
    • Видео и анимация
    • Генерация и преобразование голоса
    • Генерация изображений
    • Дизайн интерьеров и архитектура
    • Другое
    • Здоровье и благополучие
    • Искусство и креативный дизайн
    • Исследования и анализ данных
    • Маркетинг и реклама
    • Музыка и аудио
    • Написание и редактирование
    • Обнаружение ИИ и антидетекция
    • Образование и перевод
    • Офис и продуктивность
    • Повседневная жизнь
    • Право и финансы
    • Программирование и разработка
    • Социальные сети
    • Управление бизнесом
    • Чат-боты и виртуальные собеседники
    • Новости ИИ
      • Автоматизация
      • Общество и рынок труда
      • ИИ в науке
      • ИИ в развлечениях
      • Персональный ИИ
      • Робототехника и автономные системы
      • Эксперименты и тесты
      • Новости индустрии ИИ
      • Технологии и разработки
      • Применение ИИ
      • Законодательство и этика
    • Блог
    • Промты
      • Business
    Поиск
    Авторизация
    Забыли пароль?
    Регистрация
    • Главная
    • Новости
    • Новости индустрии ИИ
    • Новая гибридная система улучшает планирование для сложных визуальных задач

    Новая гибридная система улучшает планирование для сложных визуальных задач

    Автоматизация
    Влияние ИИ на общество и рынок труда
    ИИ в науке
    ИИ в развлечениях
    Персональный ИИ и инструменты
    Робототехника и автономные системы
    Эксперименты и тесты
    Новости индустрии ИИ
    Технологии и разработки
    Применение ИИ
    Законодательство и этика
    Новая гибридная система улучшает планирование для сложных визуальных задач

    Ученые из MIT разработали новую систему на основе генеративного искусственного интеллекта, которая значительно улучшает планирование долгосрочных визуальных задач. Эта технология может быть полезна для работы роботов в изменяющихся условиях или для повышения эффективности многороботных сборочных команд.

    Как работает новая система?

    Система использует специализированную модель "зрение-язык", чтобы анализировать изображение и моделировать действия, необходимые для достижения цели. Затем другая модель переводит эти симуляции в стандартный язык программирования для планирования, улучшая решение.

    В конечном итоге система автоматически создает набор файлов, которые можно загрузить в классическое программное обеспечение для планирования, чтобы разработать план для достижения цели. Этот двухэтапный процесс позволяет достигать успеха в среднем в 70% случаев, что значительно лучше по сравнению с существующими методами.

    Применение в реальных условиях

    Особенностью новой системы является способность решать задачи, с которыми она ранее не сталкивалась, что делает ее идеальной для реальных сценариев, где условия могут резко меняться.

    "Мы объединили преимущества моделей "зрение-язык", такие как понимание изображений, с сильными планировочными возможностями формальных решений", — объясняет Илюнь Хао, аспирант MIT, ведущий автор статьи об этой технике.

    Преимущества гибридного подхода

    Система VLMFP (Visual Language Model-guided Formal Planning) использует два специализированных VLM, которые работают совместно, чтобы преобразовать визуальные задачи в готовые файлы для формального планирования. Исследователи тренировали малую модель SimVLM для описания сценариев и симуляции действий, а большая модель GenVLM использует эти описания для создания файлов на языке PDDL.

    Эти файлы затем передаются в классический решатель PDDL, который вырабатывает пошаговый план для решения задачи. GenVLM сравнивает результаты решателя и симулятора, улучшая файлы PDDL.

    Гибкость и потенциал для будущего

    Система VLMFP генерирует два отдельных файла PDDL: файл домена и файл задачи. Эта структура позволяет системе адаптироваться к новым ситуациям, обеспечивая гибкость для решения разнообразных задач.

    В будущем исследователи планируют расширить возможности системы для работы с более сложными сценариями и изучить методы снижения ошибок моделей VLM.

    Эта работа финансировалась, в том числе, MIT-IBM Watson AI Lab и представляет собой важный шаг в направлении интеграции визуального планирования в ИИ-системы.

    n8n-bot
    16 апреля 2026, 06:03
    Новости индустрии ИИ

    Новости new

    Новый AI-сервис от NVIDIA трансформирует склады в интеллектуальные хабы
    Новый AI-сервис от NVIDIA трансформирует склады в интеллектуальные хабы
    Новости индустрии ИИ
    16 апреля 2026, 06:07
    OpenAI и будущее ИИ в медицине: новые продукты и вызовы
    OpenAI и будущее ИИ в медицине: новые продукты и вызовы
    Новости индустрии ИИ
    16 апреля 2026, 06:06
    Новая гибридная система улучшает планирование для сложных визуальных задач
    Новая гибридная система улучшает планирование для сложных визуальных задач
    Новости индустрии ИИ
    16 апреля 2026, 06:03
    Новая система ИИ улучшает планирование сложных визуальных задач
    Новая система ИИ улучшает планирование сложных визуальных задач
    Новости индустрии ИИ
    16 апреля 2026, 00:02
    Выберите обязательные опции

    Мы используем файлы cookie и другие средства сохранения предпочтений и анализа действий посетителей сайта. Подробнее в Согласие на обработку персональных данных. Нажмите «Принять», если даете согласие на это.

    Принять
    IntellectNews

    Вы принимаете условия политики в отношении обработки персональных данных и пользовательского соглашения каждый раз, когда оставляете свои данные в любой форме обратной связи на сайте

    IntellectNews © 2026

    IntellectNews

    Вы принимаете условия политики в отношении обработки персональных данных и пользовательского соглашения каждый раз, когда оставляете свои данные в любой форме обратной связи на сайте, IntellectNews © 2026