В индустрии ИИ появляется новая звезда — FunctionGemma. Это компактная версия модели Gemma 3 с 270 миллионами параметров, специально созданная для вызова функций и запуска на устройствах с ограниченными ресурсами. Пока большинство проектов делают упор на мощные серверы, Google показывает, что можно добиться высокой эффективности и на смартфонах или ноутбуках.
Менее чем за год разработчики создали модель, обученную на 6 триллионах токенов и поддерживающую обработку до 32 тысяч токенов за запрос. Благодаря специальному формату диалога — с контрольными токенами для определения ролей и вызова функций — система работает надежно и подходит для предпродакшн-окружений. Кроме того, модель использует словарь объемом 256K, оптимизированный под JSON и мультиязычный текст, что значительно повышает эффективность при построении API-вызывающих схем.
Что делает FunctionGemma особенной?
- Поддержка до 32 тысяч токенов — больше, чем у большинства моделей подобного масштаба
- Строгий формат диалога с разделением ролей и контрольными тегами
и , что обеспечивает надежную работу в production - Обучение на 6 триллионах токенов и доработки под конкретные задачи — результат очевиден: точность вызова функций выросла с 58% до 85% после domain-specific fine tuning
- Минимализм — модель весит порядка 0,3 миллиарда параметров и поддерживает квантование, что позволяет запускать её на смартфонах и платформах вроде NVIDIA Jetson Nano
Практическая ценность очевидна — особенно для приложений в области mobile, автоматизации и small-scale AI. Google демонстрирует реальные кейсы: Off-line помощник Mobile Actions, голосовая игра Tiny Garden и браузерная физическая симуляция Physics Playground. Всё это — признаки того, что технологии уже идут в сторону полноценного функционирования на устройствах с низкой задержкой и маленьким объемом памяти.
К чему идёт индустрия?
Очевидно, что тренд — не только создавать модели с меньшим числом параметров, но и делать их по-настоящему эффективными для edge-устройств. Ключ к успеху — структурированные вызовы функций, строгий формат диалога и domain-specific доработки. В ближайшие 12 месяцев мы увидим расширение применения подобных решений — от мобильных помощников до автономных систем контроля и IoT-устройств. Технологии, которые раньше казались недосягаемыми, сейчас становятся реальностью. Те, кто научится правильно строить такие модели, получат значительное конкурентное преимущество.
Важный вопрос — насколько быстро индустрия сможет масштабировать эти решения и обеспечить их безопасность, мониторинг и интеграцию. Пока что Google задаёт тон, демонстрируя, как аккуратно и прагматично можно использовать большие идеи в проигрышных по ресурсам сценариях.
