DeepMind анонсировал Gemini 2.5 с режимом «Deep Think» на Google I/O 2025

Москва, 3 июня 2025 г. — На ежегодной конференции Google I/O 2025 подразделение DeepMind анонсировало обновлённое семейство моделей искусственного интеллекта Gemini 2.5. В новой линейке появились две основные версии: Gemini 2.5 Flash, ориентированная на быстроту ответов в повседневных задачах, и Gemini 2.5 Pro, оптимизированная для решения сложных вычислительных и творческих задач с помощью механизма «Deep Think».

Новое поколение Gemini 2.5

Модель Gemini 2.5 Flash стала моделью по умолчанию для всех пользователей Gemini: она обеспечивает быструю генерацию текста, изображений и аудио при минимальной задержке. В свою очередь, Gemini 2.5 Pro получил расширенное окно контекста, улучшенные алгоритмы рассуждения и алгоритмы «Deep Think», способные последовательно анализировать сложные многоэтапные задачи (математические вычисления, написание и отладка кода, детализация научных отчётов). Разработчики отмечают, что Pro-версия теперь поддерживает нативный аудиовывод, что позволяет системе «озвучивать» ответы и резюмировать текстовые материалы.

Режим «Deep Think» для сложных задач

Режим «Deep Think» в Gemini 2.5 Pro активируется автоматически при обнаружении в запросе многоступенчатой логики или кода. Модель делит задачу на промежуточные шаги, проводит внутренние рассуждения и возвращает итоговый ответ с подробной обоснованной цепочкой. По словам разработчиков, это особенно эффективно при генерации сложных программных фрагментов, создании интерактивных симуляций и аналитических отчётов.

Интерактивные инструменты — Canvas и Audio Overviews

Помимо новых моделей, Google DeepMind анонсировал две функции, интегрированные в приложение Gemini:

Canvas — интерактивная рабочая область, где пользователь может одновременно вводить текст, код или делать зарисовки. Система в реальном времени предлагает исправления, пояснения к коду и визуальные аннотации без переключения между приложениями.
Audio Overviews — инструмент, превращающий текстовые документы, презентации и исследования в аудиоформат в стиле подкаста с двумя виртуальными ведущими. Пользователь может задавать вопросы по ходу «обзора», а модель дополняет информацию и делает краткие выводы.

Улучшенные навыки кодирования и мультимодальность

Gemini 2.5 Pro демонстрирует значительно лучшие результаты в автоматической генерации, оптимизации и отладке кода на различных языках программирования. Контекстное окно увеличено до 1 миллиона токенов, что позволяет модели обрабатывать крупные кодовые базы, большие текстовые файлы и долгие диалоги без потери контекста. Мультимодальные возможности расширены — помимо текста и изображений, система поддерживает генерацию и распознавание аудио, а также анализ видеопотоков в реальном времени.

Интеграция с экосистемой Google

Gemini 2.5 легко интегрируется с другими сервисами Google. Теперь модель напрямую обращается к Google Search для уточнения фактов и источников, взаимодействует с Google Lens для анализа изображений и умеет передавать данные в Google Maps. В дополнение к этому, DeepMind представил премиальную подписку «AI Ultra» стоимостью $250 в месяц, которая гарантирует приоритетный доступ к самым мощным вычислительным ресурсам, ранний доступ к экспериментальным функциям и увеличенные квоты запросов.

Доступность и планы на будущее

С сегодняшнего дня версии Gemini 2.5 Flash и Pro постепенно разворачиваются для всех пользователей в приложении Gemini и через API. Google обещает расширить поддержку на локальных языках — включая русский — в ближайшие месяцы. Далее в планах — внедрение новых моделей для генерации видео и интеграция с очками дополненной реальности, а также улучшение механизмов приватности и безопасности.

«Gemini 2.5 — это не просто крупный шаг вперёд в области ИИ, это отправная точка для создания действительно универсального ассистента, который сможет решать самые сложные задачи», — заявил представитель Google DeepMind.