MongoDB анонсировала новую архитектуру векторного поиска, которая открывает путь к масштабируемой работе с миллиардами эмбеддингов благодаря технологии квантования.
Обновление представлено в рамках улучшения MongoDB Atlas Vector Search — решения для работы с векторными представлениями данных, используемыми в системах на базе искусственного интеллекта, включая LLM и рекомендательные движки. По словам разработчиков, новая система позволяет повысить эффективность хранения и поиска векторов без значительной потери точности.
«Наша цель — обеспечить высокую масштабируемость и быструю отдачу результатов даже при работе с огромными объемами эмбеддингов», — отметили в MongoDB. Ключевой особенностью стала интеграция квантования — метода уменьшения размерности данных, который снижает объем хранения векторов в десятки раз.
Технология квантования применяется в реальном времени и не требует дополнительного программирования со стороны пользователя. Это позволяет компаниям быстрее внедрять ИИ-решения и обрабатывать сложные поисковые запросы с минимальными затратами ресурсов.
Новая архитектура уже протестирована на базе эмбеддингов от Voyage AI. Результаты показали высокую точность даже при значительном сжатии. MongoDB также подчеркивает, что решение остается полностью интегрированным с остальными возможностями Atlas, включая контроль доступа, шифрование и управление данными.
Эксперты прогнозируют, что подобные технологии могут стать стандартом в построении масштабируемых ИИ-инфраструктур, особенно в области генеративного ИИ и персонализированных систем рекомендаций.
