Обучение ИИ на слабых устройствах: технология FTTE от MIT

Искусственный интеллект стремительно развивается, однако его создание традиционно требует колоссальных вычислительных мощностей. Обычно для этого используются гигантские дата-центры, забитые мощными графическими процессорами (GPU). Но что, если перенести этот процесс на устройства, которые мы носим с собой каждый день? Исследователи из Массачусетского технологического института (MIT) нашли способ обучать нейросети прямо на умных часах, фитнес-браслетах и старых смартфонах, абсолютно не нарушая конфиденциальность пользовательских данных.

Почему локальное обучение ИИ — это проблема?

В индустрии технологий все популярнее становится федеративное обучение (federated learning). Это особый подход, при котором базовая ИИ-модель рассылается с центрального сервера на множество гаджетов пользователей. Каждое устройство дообучает алгоритм на своих локальных данных и отправляет обратно только результаты математических вычислений, а не сами личные файлы (фотографии, сообщения или пульс). Это гарантирует высокий уровень приватности.

Однако на практике этот процесс часто тормозит. Если в сети присутствуют слабые устройства с медленным интернетом или малым объемом памяти, центральному серверу приходится их ждать. Это создает серьезное «бутылочное горлышко», из-за которого обучение всей сети может зависнуть на долгое время или вовсе прерваться.

Технология FTTE: как MIT ускорили процесс

Чтобы решить проблему медленных устройств, команда MIT разработала новую архитектуру под названием FTTE (Federated Tiny Training Engine). Она позволяет эффективно объединять в одну сеть совершенно разные гаджеты, минимизируя нагрузку на их процессоры и батареи. Инновация базируется на трех ключевых принципах:

Уменьшение размера передаваемой модели: Система больше не отправляет всю тяжеловесную нейросеть целиком. Вместо этого алгоритм выбирает лишь небольшую часть параметров (внутренних переменных нейросети), которая гарантированно поместится в оперативную память самого слабого гаджета в текущей сети.
Полуасинхронные обновления: Серверу больше не нужно ждать ответа от всех участников. Он собирает поступающие обновления небольшими порциями и сразу пускает их в дело, продолжая цикл обучения без простоев.
Оценка актуальности данных: Если старенький смартфон слишком долго обрабатывал информацию и прислал устаревшие веса, сервер придаст им меньшее значение. Это делается для того, чтобы неактуальные данные не снижали общую точность финальной ИИ-модели.

Впечатляющие результаты и компромиссы

Тестирование в симуляциях с сотнями различных устройств показало впечатляющие цифры. Благодаря внедрению FTTE, процесс обучения завершается в среднем на 81% быстрее по сравнению с классическими методами федеративного обучения.

Потребление оперативной памяти на конечных устройствах снизилось на 80%, а объем передаваемого по сети трафика сократился на 69%. Конечно, ради такой скорости и экономии заряда батареи разработчикам пришлось пойти на крошечное снижение точности модели. Однако, по словам авторов исследования, в большинстве реальных сценариев этот компромисс абсолютно оправдан, учитывая гигантский прирост производительности.

Тесты на реальном оборудовании

Помимо компьютерных симуляций, исследователи проверили работу алгоритма на небольшой сети из реальных микрокомпьютеров с разными вычислительными мощностями. Результаты подтвердили высокую масштабируемость системы: чем больше устройств подключалось к сети, тем заметнее становилась выгода от использования FTTE.

Почему это важно для индустрии ИИ?

В первую очередь, это открытие дает зеленый свет для внедрения умных алгоритмов в сферах с максимально жесткими требованиями к безопасности, таких как здравоохранение и финансы. Медицинские показатели пациентов или истории банковских транзакций никогда не покинут устройство, но при этом помогут сделать глобальные алгоритмы умнее и точнее.

Кроме того, технология стирает цифровое неравенство. Как отмечают авторы исследования, далеко не у всех пользователей есть флагманские смартфоны последних поколений. Новый метод позволит жителям развивающихся стран с бюджетными телефонами также стать полноценными участниками создания глобальных ИИ-сетей. В будущем ученые планируют доработать систему, чтобы ИИ мог не только обучаться для общей пользы, но и глубоко персонализироваться под привычки конкретного пользователя прямо на его устройстве.

ИИ на умных часах: MIT ускорил безопасное обучение нейросетей на 81%

Почему локальное обучение ИИ — это проблема?

Технология FTTE: как MIT ускорили процесс

Впечатляющие результаты и компромиссы

Тесты на реальном оборудовании

Почему это важно для индустрии ИИ?

Новости new