IntellectNews
IntellectNews
    IntellectNews
    • Анализ изображений
    • Бизнес-исследования
    • Видео и анимация
    • Генерация и преобразование голоса
    • Генерация изображений
    • Дизайн интерьеров и архитектура
    • Другое
    • Здоровье и благополучие
    • Искусство и креативный дизайн
    • Исследования и анализ данных
    • Маркетинг и реклама
    • Музыка и аудио
    • Написание и редактирование
    • Обнаружение ИИ и антидетекция
    • Образование и перевод
    • Офис и продуктивность
    • Повседневная жизнь
    • Право и финансы
    • Программирование и разработка
    • Социальные сети
    • Управление бизнесом
    • Чат-боты и виртуальные собеседники
    • Новости ИИ
      • Автоматизация
      • Общество и рынок труда
      • ИИ в науке
      • ИИ в развлечениях
      • Персональный ИИ
      • Робототехника и автономные системы
      • Эксперименты и тесты
      • Новости индустрии ИИ
      • Технологии и разработки
      • Применение ИИ
      • Законодательство и этика
    • Блог
    • Промты
      • Business
    Поиск
    Авторизация
    Забыли пароль?
    Регистрация
    • Главная
    • Новости
    • Технологии и разработки
    • Mistral выпустила Voxtral Transcribe 2: новые модели для масштабного мультиязычного автоматического распознавания речи

    Voxtral Transcribe 2: масштабные модели для мульти-языкового распознавания

    Автоматизация
    Влияние ИИ на общество и рынок труда
    ИИ в науке
    ИИ в развлечениях
    Персональный ИИ и инструменты
    Робототехника и автономные системы
    Эксперименты и тесты
    Новости индустрии ИИ
    Технологии и разработки
    Применение ИИ
    Законодательство и этика
    Voxtral Transcribe 2: масштабные модели для мульти-языкового распознавания
    Обновленная платформа Voxtral для бизнеса и реального времени

    Глава индустрии ASR (автоматического распознавания речи) постепенно переключается с экспериментальных решений на реальные крупномасштабные системы. Компания Mistral анонсировала Voxtral Transcribe 2, в котором реализованы две модели — одна для пакетной обработки с диаризацией, другая — для потокового распознавания в реальном времени. Обе поддерживают 13 языков, включая английский, русский и китайский.

    Voxtral Mini Transcribe V2 позволяет бизнесам получать точную транскрипцию и разделение говорящих, управляемое через API. По заявлению разработчиков, точность достигает 96% (WER около 4%), что превосходит конкурентов по цене — $0.003 за минуту. Эта модель идеально подходит для собраний, конференций и многосторонних звонков.

    Второй продукт — Voxtral Realtime — это модель для потокового распознавания с задержкой от 80 миллисекунд до 2.4 секунд. В её основе — около 4 миллиардов параметров, объединяющих языковую модель и аудиокодер. Благодаря архитектуре с каскадным вниманием, система способна работать на простом GPU с 16 ГБ памяти и запускаться даже на Edge-устройствах. При задержке в 480 мс достигается качество, сравнимое с оффлайн-распознаванием.

    Правда, deployment у моделей разный: Mini — через API и playground за $0.003/минуту, Realtime — с открытыми весами на Hugging Face по лицензии Apache 2.0 и стоит $0.006/минуту. Важные фичи Mini включают диаризацию с точным таймингом, настройку по контексту, отметки времени для слов, шумоустойчивость и поддержку до трёх часов аудио. В основном, решение ориентировано на бизнес-задачи — встречи, конференции, рабочие звонки.

    В итоге, Voxtral Transcribe 2 задаёт новые стандарты масштабируемого, мультиязычного ASR: выделяется качеством, низкой задержкой и гибкими возможностями развертывания. В индустрии уже понимают — для успеха нужно не только сила модели, а правильная архитектура и подготовка данных.

    n8n-bot
    6 февраля 2026, 06:10
    Технологии и разработки

    Читайте также...

    Hugging Face Hugging Face
    Hugging Face — платформа в сфере ИИ, фокусирующаяся на моделях обработки естественного языка. Она предоставляет репозито...
    Mistral Mistral
    Платформа для обучения и запоминания, которая помогает организовать и сохранить знания для практического применения, обе...
    NVIDIA NVIDIA
    NVIDIA – это ведущая компания в области вычислений на основе искусственного интеллекта, разрабатывающая графические проц...

    Новости new

    Искусственный интеллект помогает создавать мебель по текстовому запросу
    Искусственный интеллект помогает создавать мебель по текстовому запросу
    Новости индустрии ИИ
    16 марта 2026, 15:05
    Как MIT защищает данные пациентов от утечек при помощи ИИ
    Как MIT защищает данные пациентов от утечек при помощи ИИ
    Новости индустрии ИИ
    16 марта 2026, 15:03
    Последние события в мире ИИ: ключевые новости и разработки
    Последние события в мире ИИ: ключевые новости и разработки
    Новости индустрии ИИ
    16 марта 2026, 09:02
    Пять перспективных стартапов получили поддержку в AI-акселераторе Google и Accel India
    Пять перспективных стартапов получили поддержку в AI-акселераторе Google и Accel India
    Новости индустрии ИИ
    16 марта 2026, 03:05
    Выберите обязательные опции

    Мы используем файлы cookie и другие средства сохранения предпочтений и анализа действий посетителей сайта. Подробнее в Согласие на обработку персональных данных. Нажмите «Принять», если даете согласие на это.

    Принять
    IntellectNews

    Вы принимаете условия политики в отношении обработки персональных данных и пользовательского соглашения каждый раз, когда оставляете свои данные в любой форме обратной связи на сайте

    IntellectNews © 2026

    IntellectNews

    Вы принимаете условия политики в отношении обработки персональных данных и пользовательского соглашения каждый раз, когда оставляете свои данные в любой форме обратной связи на сайте, IntellectNews © 2026