Google выпустила модель FunctionGemma, специально сделанную для преобразования естественного языка в вызовы API. Она основана на архитектуре Gemma 3 и содержит 270 миллионов параметров.
В отличие от обычных чат-ботов, FunctionGemma сосредоточена на вызове функций, а не на свободной переписке. Это делает её идеальной для задач, где нужно переводить запросы пользователей в строго структурированные команды.
Модель поддерживает 256 тысяч токенов в словаре, что позволяет обрабатывать большие объёмы данных. На обучение потрачено три билиона слов, а финальный статус — открытая модель по лицензии Gemma. Она тренируется на публичных API, взаимодействиях с инструментами и промптах, учится отличать, когда нужно вызвать функцию, как правильно её форматировать и когда запрашивать больше информации.
Особенность — модель использует строгие шаблоны диалогов с контрольными маркерами, разделяющими роли и операции. Это обеспечивает надёжную работу в продакшене, особенно для устройств без постоянного подключения к облаку.
Google акцентирует внимание, что для достижения высокой точности в специальных областях необходимо дообучение модели на релевантных данных. Так, например, на датасете Mobile Actions — наборе инструментов для Андроида — базовая модель показывает 58% точности. После обучения на специализированных данных этот показатель увеличился до 85%.
Производство активно развивается в направлении low-power устройств: смартфонов, ноутбуков и мини-компьютеров типа NVIDIA Jetson Nano, где важна минимальная память и низкая задержка. Именно для таких платформ Google адаптирует модели с помощью квантизации и уменьшения размеров.
В числе демонстрационных проектов — Mobile Actions, Tiny Garden и Physics Playground. Все они показывают, что модель с 270 миллионами параметров способна справляться с многошаговой логикой без обращения к серверам, если есть правильные интерфейсы и доработка.
Общий вывод — FunctionGemma это открытая, компактная модель, ориентированная на вызов функций, а не на ведение диалогов. Важен фокус на доменную адаптацию и использование специальных данных, а не только на промпты. Это открывает новые возможности для внедрения ИИ на, казалось бы, стандартных устройствах.
Google делится разработкой на платформах Hugging Face и Vertex AI, а также в своих демонстрационных проектах. Об актуальности говорит и то, что модель поддерживается широким сообществом, а обновления ждут все, кто заинтересован в легкой и производительной интеграции ИИ в мобильных и IoT устройство.
