IntellectNews
IntellectNews
    IntellectNews
    • Анализ изображений
    • Бизнес-исследования
    • Видео и анимация
    • Генерация и преобразование голоса
    • Генерация изображений
    • Дизайн интерьеров и архитектура
    • Другое
    • Здоровье и благополучие
    • Искусство и креативный дизайн
    • Исследования и анализ данных
    • Маркетинг и реклама
    • Музыка и аудио
    • Написание и редактирование
    • Обнаружение ИИ и антидетекция
    • Образование и перевод
    • Офис и продуктивность
    • Повседневная жизнь
    • Право и финансы
    • Программирование и разработка
    • Социальные сети
    • Управление бизнесом
    • Чат-боты и виртуальные собеседники
    • Новости ИИ
      • Автоматизация
      • Общество и рынок труда
      • ИИ в науке
      • ИИ в развлечениях
      • Персональный ИИ
      • Робототехника и автономные системы
      • Эксперименты и тесты
      • Новости индустрии ИИ
      • Технологии и разработки
      • Применение ИИ
      • Законодательство и этика
    • Блог
    • Промты
      • Business
    Поиск
    Авторизация
    Забыли пароль?
    Регистрация
    • Главная
    • Новости
    • Новости индустрии ИИ
    • Audio Flamingo 3: открытая модель с интеллектом звука

    Audio Flamingo 3 от NVIDIA: открытая модель для глубокого понимания и рассуждения звука

    Автоматизация
    Влияние ИИ на общество и рынок труда
    ИИ в науке
    ИИ в развлечениях
    Персональный ИИ и инструменты
    Робототехника и автономные системы
    Эксперименты и тесты
    Новости индустрии ИИ
    Технологии и разработки
    Применение ИИ
    Законодательство и этика
     Audio Flamingo 3 от NVIDIA: открытая модель для глубокого понимания и рассуждения звука

    Представьте себе модель, которая не просто распознаёт речь или классифицирует звуки, но понимает их, рассуждает и ведёт полноценный диалог — и всё это в открытом доступе. Именно такой шаг сделала NVIDIA, выпустив Audio Flamingo 3.

    Audio Flamingo 3 – это полностью открытая Large Audio Language Model (LALM) с прорывными возможностями в аудиопонимании и логическом анализе более чем по 20 бенчмаркам. Забудьте о простом «что сказал человек» или «это музыка или шум»: новая модель умеет вникать в контекст, формулировать цепочку рассуждений и отвечать на многократные запросы по разным аудиофайлам.

    Ключевые возможности Audio Flamingo 3

    Во‑первых, модель поддерживает диалоги на нескольких аудиовходах: передали ей запись концерта, подкаста и шум вокруг — и она поспешит ответить на уточняющие вопросы. Во‑вторых, «on-demand thinking» позволяет получать поэтапные рассуждения (chain-of-thought) в ответ на сложные задания. И, наконец, аудиоконтекст может длиться до 10 минут, что позволяет разбирать длинные записи полностью.

    AF3-Chat и экосистема данных

    Помимо базовой модели NVIDIA представила AF3-Chat – вариант, настроенный специально для многопользовательского голосового чата «голос-в-голос». А чтобы сообщества разработчиков и исследователей могли быстро запустить свои эксперименты, NVIDIA выложила код, рецепты обучения и целых 4 новых датасета: AudioSkills‑XL (10 млн пар «вопрос-ответ»), LongAudio‑XL, AF‑Think и AF‑Chat.

    В основе Audio Flamingo 3 лежат инновации в представлении аудио (единая энкодерная архитектура для речи, звуков и музыки) и оптимизированные стратегии обучения, а декодерная часть опирается на Qwen2.5‑7B — популярную LLM с открытым исходным кодом.

    Открытость проекта гарантирует, что каждый сможет проверить идеи, предложить улучшения и встроить Audio Flamingo 3 в свои продукты — от интеллектуальных голосовых помощников до инструментов анализа музыки и длинных подкастов. Готовы к звуковой революции?

    17 июля 2025, 13:13
    Новости индустрии ИИ

    Связанные ИИ

    ChatGPT ChatGPT
    ChatGPT — это продвинутый искусственный интеллект от OpenAI, разработанный для общения с пользователями на естественном ...
    NVIDIA NVIDIA
    NVIDIA – это ведущая компания в области вычислений на основе искусственного интеллекта, разрабатывающая графические проц...

    Новости new

    Искусственный интеллект помогает создавать мебель по текстовому запросу
    Искусственный интеллект помогает создавать мебель по текстовому запросу
    Новости индустрии ИИ
    16 марта 2026, 15:05
    Как MIT защищает данные пациентов от утечек при помощи ИИ
    Как MIT защищает данные пациентов от утечек при помощи ИИ
    Новости индустрии ИИ
    16 марта 2026, 15:03
    Последние события в мире ИИ: ключевые новости и разработки
    Последние события в мире ИИ: ключевые новости и разработки
    Новости индустрии ИИ
    16 марта 2026, 09:02
    Пять перспективных стартапов получили поддержку в AI-акселераторе Google и Accel India
    Пять перспективных стартапов получили поддержку в AI-акселераторе Google и Accel India
    Новости индустрии ИИ
    16 марта 2026, 03:05
    Выберите обязательные опции

    Мы используем файлы cookie и другие средства сохранения предпочтений и анализа действий посетителей сайта. Подробнее в Согласие на обработку персональных данных. Нажмите «Принять», если даете согласие на это.

    Принять
    IntellectNews

    Вы принимаете условия политики в отношении обработки персональных данных и пользовательского соглашения каждый раз, когда оставляете свои данные в любой форме обратной связи на сайте

    IntellectNews © 2026

    IntellectNews

    Вы принимаете условия политики в отношении обработки персональных данных и пользовательского соглашения каждый раз, когда оставляете свои данные в любой форме обратной связи на сайте, IntellectNews © 2026