IntellectNews
IntellectNews
    IntellectNews
    • Анализ изображений
    • Бизнес-исследования
    • Видео и анимация
    • Генерация и преобразование голоса
    • Генерация изображений
    • Дизайн интерьеров и архитектура
    • Другое
    • Здоровье и благополучие
    • Искусство и креативный дизайн
    • Исследования и анализ данных
    • Маркетинг и реклама
    • Музыка и аудио
    • Написание и редактирование
    • Обнаружение ИИ и антидетекция
    • Образование и перевод
    • Офис и продуктивность
    • Повседневная жизнь
    • Право и финансы
    • Программирование и разработка
    • Социальные сети
    • Управление бизнесом
    • Чат-боты и виртуальные собеседники
    • Новости ИИ
      • Автоматизация
      • Общество и рынок труда
      • ИИ в науке
      • ИИ в развлечениях
      • Персональный ИИ
      • Робототехника и автономные системы
      • Эксперименты и тесты
      • Новости индустрии ИИ
      • Технологии и разработки
      • Применение ИИ
      • Законодательство и этика
    • Блог
    • Промты
      • Business
    Поиск
    Авторизация
    Забыли пароль?
    Регистрация
    • Главная
    • Новости
    • Технологии и разработки
    • NVIDIA выпустила Dynamo v0.9.0: масштабная перестройка инфраструктуры с FlashIndexer и поддержки мультимодальных данных

    Обновление Dynamo v0.9.0 от NVIDIA — новые горизонты для ИИ

    Автоматизация
    Влияние ИИ на общество и рынок труда
    ИИ в науке
    ИИ в развлечениях
    Персональный ИИ и инструменты
    Робототехника и автономные системы
    Эксперименты и тесты
    Новости индустрии ИИ
    Технологии и разработки
    Применение ИИ
    Законодательство и этика
    Обновление Dynamo v0.9.0 от NVIDIA — новые горизонты для ИИ
    NVIDIA перерабатывает инфраструктуру для масштабных ИИ-моделей

    На фоне бурного роста требований к масштабируемым системам ИИ NVIDIA анонсировала выпуск Dynamo v0.9.0 — самой значительной модернизации фреймворка для распределённых инференсов.

    Главное нововведение — отказ от тяжелых зависимостей NATS и ETCD в пользу более лёгких решений: Event Plane и Discovery Plane на базе ZeroMQ и MessagePack. Это делает инфраструктуру более лаконичной и удобной в процессе эксплуатации.

    Интеграция мультимодальных возможностей

    Динамика развития связана с расширением поддержки мультимодальных данных: теперь три бэкенда — vLLM, SGLang и TensorRT-LLM — позволяют обрабатывать текст, изображения и видео в рамках одного фреймворка.

    Разделение кодировщиков для масштабированного решения

    Появилась технология Encoder Disaggregation — разделение процессов Encode, Prefill и Decode, что позволяет запускать их на разных GPU. Благодаря этому решения становятся масштабируемыми и более эффективными.

    Функция FlashIndexer: что изменилось

    Новинка предназначена для сокращения задержек при управлении кешем с большими контекстными окнами. Вместо медленного поиска по кешу — более быстрый индекс и доступ к нужным токенам, что снижает время до первого токена и приближается к скорости локальных инференсов.

    Улучшенное управление трафиком с помощью прогнозов

    Интеллектуальный планировщик с использованием фильтров Калмана позволяет точнее предсказывать нагрузку GPUs и пики трафика. Также внедрены маршрутизирующие подсказки через API Gateway Kubernetes, что повышает точность распределения запросов.

    Обновлены основные компоненты: vLLM до версии 0.14.1, SGLang — 0.5.8, TensorRT-LLM — 1.3.0rc1, NIXL до 0.9.0, а также библиотека dynamo-tokens в Rust, ускоряющая обработку токенов.

    Все эти изменения позволяют полностью отказаться от dependence on NATS и ETCD, перейти к более гибкой и легкой архитектуре, а также реализовать полноценную поддержку мультимодальных данных с высокой скоростью и надежностью. В будущем ожидается закрепление тренда на более сложные и масштабируемые инференс-системы, где ключевую роль сыграют автоматизация и предиктивное управление нагрузкой.

    n8n-bot
    21 февраля 2026, 06:10
    Технологии и разработки

    Читайте также: инновации в инфраструктуре ИИ

    NVIDIA NVIDIA
    NVIDIA – это ведущая компания в области вычислений на основе искусственного интеллекта, разрабатывающая графические проц...
    Dynamo Dynamo
    Платформа, предназначенная для улучшения конверсии в социальных сетях, помогает пользователям масштабировать свой стиль,...

    Новости new

    Искусственный интеллект помогает создавать мебель по текстовому запросу
    Искусственный интеллект помогает создавать мебель по текстовому запросу
    Новости индустрии ИИ
    16 марта 2026, 15:05
    Как MIT защищает данные пациентов от утечек при помощи ИИ
    Как MIT защищает данные пациентов от утечек при помощи ИИ
    Новости индустрии ИИ
    16 марта 2026, 15:03
    Последние события в мире ИИ: ключевые новости и разработки
    Последние события в мире ИИ: ключевые новости и разработки
    Новости индустрии ИИ
    16 марта 2026, 09:02
    Пять перспективных стартапов получили поддержку в AI-акселераторе Google и Accel India
    Пять перспективных стартапов получили поддержку в AI-акселераторе Google и Accel India
    Новости индустрии ИИ
    16 марта 2026, 03:05
    Выберите обязательные опции

    Мы используем файлы cookie и другие средства сохранения предпочтений и анализа действий посетителей сайта. Подробнее в Согласие на обработку персональных данных. Нажмите «Принять», если даете согласие на это.

    Принять
    IntellectNews

    Вы принимаете условия политики в отношении обработки персональных данных и пользовательского соглашения каждый раз, когда оставляете свои данные в любой форме обратной связи на сайте

    IntellectNews © 2026

    IntellectNews

    Вы принимаете условия политики в отношении обработки персональных данных и пользовательского соглашения каждый раз, когда оставляете свои данные в любой форме обратной связи на сайте, IntellectNews © 2026