IntellectNews
IntellectNews
    IntellectNews
    • Анализ изображений
    • Бизнес-исследования
    • Видео и анимация
    • Генерация и преобразование голоса
    • Генерация изображений
    • Дизайн интерьеров и архитектура
    • Другое
    • Здоровье и благополучие
    • Искусство и креативный дизайн
    • Исследования и анализ данных
    • Маркетинг и реклама
    • Музыка и аудио
    • Написание и редактирование
    • Обнаружение ИИ и антидетекция
    • Образование и перевод
    • Офис и продуктивность
    • Повседневная жизнь
    • Право и финансы
    • Программирование и разработка
    • Социальные сети
    • Управление бизнесом
    • Чат-боты и виртуальные собеседники
    • Новости ИИ
      • Автоматизация
      • Общество и рынок труда
      • ИИ в науке
      • ИИ в развлечениях
      • Персональный ИИ
      • Робототехника и автономные системы
      • Эксперименты и тесты
      • Новости индустрии ИИ
      • Технологии и разработки
      • Применение ИИ
      • Законодательство и этика
    • Блог
    • Промты
      • Business
    Поиск
    Авторизация
    Забыли пароль?
    Регистрация
    • Главная
    • Новости
    • Технологии и разработки
    • NVIDIA представляет PersonaPlex-7B-v1: модель реального времени для естественных полудуплексных разговоров

    NVIDIA запускает модель PersonaPlex-7B-v1 для реальных разговоров

    Автоматизация
    Влияние ИИ на общество и рынок труда
    ИИ в науке
    ИИ в развлечениях
    Персональный ИИ и инструменты
    Робототехника и автономные системы
    Эксперименты и тесты
    Новости индустрии ИИ
    Технологии и разработки
    Применение ИИ
    Законодательство и этика
    NVIDIA запускает модель PersonaPlex-7B-v1 для реальных разговоров
    Обзор новой модели NVIDIA PersonaPlex-7B-v1

    Разработчики столкнулись с проблемой: традиционные системы преобразуют речь в текст, создают ответ и снова превращают в речь. Это тяжело по времени и потеряно естественное ощущение диалога. NVIDIA решила объединить все этапы в одну модель – PersonaPlex-7B-v1, способную слушать и говорить одновременно.

    Эта модель базируется на трансформерах и использует нейронный кодек для обработки потокового аудио, прогнозируя и текстовые, и аудиотокены. Её легко интегрировать в системы для естественных разговоров: модель способна управлять перехватами, прерываниями, мгновенными сменами ролей и даже поддерживать естественные «подхваты» беседы.

    Как устроена PersonaPlex и чем удивляет

    • Модель при помощи гибридных подсказок (prompting) задаёт личность говорящего, включая голосовые параметры и стиль
    • Обучена на смешанных датасетах: как реальных, так и синтетических разговоров, — особенно ценна работа с 7,3 тысячами звонков из базы Fisher и синтетикой, созданной с помощью GPT-OSS-120B
    • Архитектура включает компоненты Mimi для обработки речи и Helium в качестве языка модели, обеспечивая понимание даже вне тренировочного датасета

    Тестирование показало: PersonaPlex достигает скорости переключения 0,908 при задержке 0,170 сек и почти полного уровня перехватов (0,950) при задержке 0,240 сек. Встроенная похожесть голосов достигает 0,650 по метрикам WavLM, превосходит многие аналоги на рынке.

    Пользователи могут уже сейчас получить доступ к исходному коду и весам модели под лицензией MIT — модель обещает сделать диалог по-настоящему живым и быстрым.

    Индустрия развивается: вместо множества раздельных компонентов всё чаще создаются универсальные модели, умеющие слушать и говорить одновременно. В будущем ожидается рост эффективности, расширение роли моделей и появление новых методов обеспечения размытых границ между аудио и текстом в диалоговых системах.

    Главный вызов — оптимизация скорости, управление фрагментарными диалогами и масштабируемость. Те, кто освоит новые подходы сейчас, остаются на передовой.

    n8n-bot
    19 января 2026, 06:09
    Технологии и разработки

    Читайте также...

    NVIDIA NVIDIA
    NVIDIA – это ведущая компания в области вычислений на основе искусственного интеллекта, разрабатывающая графические проц...

    Новости new

    Искусственный интеллект помогает создавать мебель по текстовому запросу
    Искусственный интеллект помогает создавать мебель по текстовому запросу
    Новости индустрии ИИ
    16 марта 2026, 15:05
    Как MIT защищает данные пациентов от утечек при помощи ИИ
    Как MIT защищает данные пациентов от утечек при помощи ИИ
    Новости индустрии ИИ
    16 марта 2026, 15:03
    Последние события в мире ИИ: ключевые новости и разработки
    Последние события в мире ИИ: ключевые новости и разработки
    Новости индустрии ИИ
    16 марта 2026, 09:02
    Пять перспективных стартапов получили поддержку в AI-акселераторе Google и Accel India
    Пять перспективных стартапов получили поддержку в AI-акселераторе Google и Accel India
    Новости индустрии ИИ
    16 марта 2026, 03:05
    Выберите обязательные опции

    Мы используем файлы cookie и другие средства сохранения предпочтений и анализа действий посетителей сайта. Подробнее в Согласие на обработку персональных данных. Нажмите «Принять», если даете согласие на это.

    Принять
    IntellectNews

    Вы принимаете условия политики в отношении обработки персональных данных и пользовательского соглашения каждый раз, когда оставляете свои данные в любой форме обратной связи на сайте

    IntellectNews © 2026

    IntellectNews

    Вы принимаете условия политики в отношении обработки персональных данных и пользовательского соглашения каждый раз, когда оставляете свои данные в любой форме обратной связи на сайте, IntellectNews © 2026