Google открывает Gemini Embedding-001 для разработчиков
Сегодня Google объявила о полной доступности своей первой мультилингвальной модели эмбеддингов, gemini-embedding-001, в Gemini API и Vertex AI. Представьте себе: один инструмент для анализа текста, поиска по смыслу и классификации—работает с более чем 100 языками.
Подробности модели
gemini-embedding-001 заняла первое место в MTEB Multilingual ещё в марте и не сдаёт позиций. Что за секрет? Техника Matryoshka Representation Learning, позволяющая выбирать «глубину» вектора—3072, 1536 или 768 размерностей. Нужно сэкономить на хранилище? Просто уменьшите размерность. А когда важна точность—ставьте максимум.
Тарифы и ограничения
Для тестов доступен бесплатный уровень: вам не придётся сразу платить. Когда же проект выйдет в продакшен, оплата составит $0,15 за миллион входных токенов. Лимиты легко расширить через платную подписку в Gemini API.
Начните работу
Чтобы попробовать модель, зайдите в Google AI Studio и используйте endpoint embed_content. Вот пример на Python:
from google import genai
client = genai.Client()
result = client.models.embed_content(
model="gemini-embedding-001",
contents="Что такое смысл жизни?"
)
print(result.embeddings)
Экспериментальная версия gemini-embedding-exp-03-07 будет доступна до 14 августа 2025 года; устаревшие модели выйдут из поддержки к концу января 2026. Рекомендуем перейти на свежую модель заранее, чтобы избежать внезапных сюрпризов.
Скоро в Batch API появится поддержка асинхронной обработки—идеально для больших объёмов данных и снижения затрат. Интересно, какие новые возможности раскроются с такими инструментами?

