Компания Google анонсировала Gemini 3.1 Flash Live – свою самую передовую модель для работы с аудио, которая обещает сделать голосовые взаимодействия более естественными и надежными. Эта технология позволит разработчикам создавать голосовых агентов, способных выполнять сложные задачи в реальном времени.
Что нового в Gemini 3.1 Flash Live?
Новая модель отличается высокой скоростью и улучшенной точностью, что позволяет создавать более плавные и естественные диалоги. Это особенно важно для индустрии ИИ, поскольку такие технологии становятся основой для голосовых интерфейсов в различных продуктах.
По сравнению с предыдущими версиями, Gemini 3.1 Flash Live показывает высокие результаты в тестах, таких как ComplexFuncBench Audio, где она достигла 90.8% точности, и Audio MultiChallenge от Scale AI, с результатом 36.1% для сложных инструкций.
Доступность и применение
Gemini 3.1 Flash Live доступна через Gemini Live API в Google AI Studio для разработчиков, а также в Gemini Enterprise for Customer Experience для бизнеса. Обычные пользователи могут оценить её возможности через Search Live и Gemini Live.
Одним из ключевых преимуществ новой модели является её многоязычность, что позволяет использовать её в более чем 200 странах и территориях. Это открывает новые горизонты для глобальных взаимодействий и улучшает пользовательский опыт.
Безопасность и надежность
Все аудиофайлы, созданные с помощью 3.1 Flash Live, имеют водяной знак SynthID, что помогает предотвратить распространение дезинформации, сохраняя высокую степень надежности.
Эта модель представляет собой значительный шаг вперед в развитии аудио ИИ, и мы с нетерпением ждем, как она будет использоваться в новых проектах и продуктах.
