Париж, Франция. Французская AI-компания LightOn анонсировала выпуск новой модели семантического поиска — GTE ModernColBERT v1, разработанной специально для работы с длинными документами. Модель демонстрирует лидерство на ключевых бенчмарках и сочетает масштабируемость с высокой точностью.
ModernColBERT v1 — это токен-уровневая модель dense retrieval, созданная на основе архитектуры ColBERT, которая получила поддержку от GTE (General Text Embeddings). Новая версия позволяет эффективно искать и анализировать информацию в объемных текстах, сохраняя при этом высокую производительность и точность.
По заявлениям разработчиков, модель показала выдающиеся результаты в сравнении с другими системами поиска на популярных датасетах, включая BEIR, LoTTE и LongEval. Её архитектура позволяет использовать параллельные вычисления и работать с несколькими GPU, что делает модель пригодной для промышленного применения в системах поиска и аналитики.
LightOn также открыла доступ к модели через платформу HuggingFace, что делает её доступной для исследователей и разработчиков по всему миру.
GTE ModernColBERT v1 — важный шаг в развитии технологий семантического поиска, особенно в контексте обработки длинных документов, юридических и научных текстов.

