На платформе Amazon SageMaker JumpStart стал доступен новый мультимодальный эмбеддинг-модель Cohere Embed v4, сочетающий в себе обработку текста и изображений. Это открывает новые возможности для построения ИИ-приложений с улучшенным пониманием контекста.
Компания Cohere представила Embed v4 — обновлённую модель эмбеддингов, которая теперь официально интегрирована в сервис Amazon SageMaker JumpStart. Это решение позволяет разработчикам быстро и легко внедрять передовые возможности мультимодальной семантики в свои проекты, не требуя глубоких знаний в области машинного обучения.
Embed v4 отличается улучшенной производительностью и точностью в задачах сопоставления текстов и изображений, поиска по смыслу, классификации, кластеризации и создания рекомендаций. Модель поддерживает несколько языков, включая английский, испанский, французский, немецкий и итальянский.
Модель прошла обучение на масштабных разнородных данных, что позволило ей повысить качество представлений как для коротких, так и для длинных текстов. Кроме того, особое внимание было уделено снижению предвзятости и повышению устойчивости к токсичности — ключевые требования для безопасного коммерческого использования ИИ.
Пользователи SageMaker JumpStart могут выбрать Embed v4 из каталога готовых решений, протестировать её и интегрировать в корпоративные процессы буквально в несколько кликов. При этом возможно использование как API-интерфейса, так и запуска в изолированной среде для соблюдения требований к приватности данных.
По мнению специалистов, появление таких моделей в доступной форме приближает бизнес и разработчиков к реальному внедрению интеллектуальных решений в сферах поиска, поддержки клиентов, анализа данных и персонализации контента. Поддержка мультимодальности также открывает перспективы для создания новых интерфейсов взаимодействия между человеком и ИИ.
