Mistral AI анонсировала OCR 3 — новую, более компактную модель для распознавания текста, которая станет частью их Document AI. Эта модель, известная как mistral-ocr-2512, способна извлекать текст и изображения из PDF и других форматов, сохраняя структуру документа. Стоимость услуги составляет NULL за 1000 страниц, но при использовании Batch API цена снижается до NULL за 1000 страниц.
OCR 3 ориентирована на обработку типичных корпоративных документов: форм, сканированных материалов, сложных таблиц и рукописного текста. Mistral утверждает, что модель показывает 74% успеха по сравнению с предыдущей версией OCR 2, что делает её конкурентоспособной на рынке.
Особенности и улучшения
- Улучшенное распознавание рукописного текста и сложных таблиц.
- Поддержка различных форматов документов и изображений.
- Возможность интеграции с аналитическими системами без дополнительной обработки.
OCR 3 — это часть стека Document AI от Mistral, который также включает возможности извлечения структурированных данных и ответы на вопросы по документам. Модель доступна через публичный API, что позволяет командам быстро прототипировать и запускать рабочие процессы.
Эта новинка может значительно упростить работу с документами в крупных организациях, снизив затраты и повысив точность обработки данных.

