Группа исследователей из Массачусетского технологического института (MIT) разработала новую систему визуализации, которая позволяет роботам "видеть" скрытые объекты и понимать внутренние сцены, используя отраженные Wi-Fi сигналы. Это стало возможным благодаря применению специально обученных моделей генеративного искусственного интеллекта.
Как работают системы беспроводного видения
Технология основана на способности беспроводных сигналов проходить через многие поверхности, отражаясь от скрытых объектов. Ранее методы, использовавшие такие сигналы, сталкивались с ограничениями точности. Однако теперь, благодаря генерирующим ИИ моделям, система может более точно восстанавливать формы объектов, что значительно улучшает возможности роботов в манипуляции и обнаружении.
Реконструкция целых сцен
Помимо восстановления отдельных объектов, исследователи представили расширенную систему, способную реконструировать целые комнаты. Для этого используется отражение сигналов от людей, движущихся в помещении. Это позволяет создать полное изображение сцены, сохраняя при этом приватность, поскольку не используются камеры.
Применение в повседневной жизни
Эти инновации могут найти применение в различных сферах. Например, на складах роботы смогут проверять упакованные товары перед отправкой, снижая количество возвратов. В умных домах такие системы помогут роботам безопасно взаимодействовать с людьми, определяя их местонахождение в комнате.
Достижения и планы на будущее
Разработанная система, получившая название Wave-Former, уже доказала свою эффективность, восстанавливая формы около 70 различных объектов с точностью на 20% выше современных методов. В будущем команда намерена улучшить детализацию реконструкций и разрабатывать крупные базовые модели для беспроводных сигналов, что может открыть новые возможности для применения технологий ИИ.
Эта работа поддерживается Национальным научным фондом (NSF), MIT Media Lab и компанией Amazon.
