IntellectNews
IntellectNews
    IntellectNews
    • Анализ изображений
    • Бизнес-исследования
    • Видео и анимация
    • Генерация и преобразование голоса
    • Генерация изображений
    • Дизайн интерьеров и архитектура
    • Другое
    • Здоровье и благополучие
    • Искусство и креативный дизайн
    • Исследования и анализ данных
    • Маркетинг и реклама
    • Музыка и аудио
    • Написание и редактирование
    • Обнаружение ИИ и антидетекция
    • Образование и перевод
    • Офис и продуктивность
    • Повседневная жизнь
    • Право и финансы
    • Программирование и разработка
    • Социальные сети
    • Управление бизнесом
    • Чат-боты и виртуальные собеседники
    • Новости ИИ
      • Автоматизация
      • Общество и рынок труда
      • ИИ в науке
      • ИИ в развлечениях
      • Персональный ИИ
      • Робототехника и автономные системы
      • Эксперименты и тесты
      • Новости индустрии ИИ
      • Технологии и разработки
      • Применение ИИ
      • Законодательство и этика
    • Блог
    • Промты
      • Business
    Поиск
    Авторизация
    Забыли пароль?
    Регистрация
    • Главная
    • Новости
    • Технологии и разработки
    • Microsoft представляет Maia 200: новый AI-ускоритель для inference в Azure

    Microsoft раскрывает Maia 200: лидер в области inference AI

    Автоматизация
    Влияние ИИ на общество и рынок труда
    ИИ в науке
    ИИ в развлечениях
    Персональный ИИ и инструменты
    Робототехника и автономные системы
    Эксперименты и тесты
    Новости индустрии ИИ
    Технологии и разработки
    Применение ИИ
    Законодательство и этика
    Microsoft раскрывает Maia 200: лидер в области inference AI
    Microsoft Maia 200 — инновационный AI-ускоритель для масштабных задач inference

    Rядовая история слияния технологий и инженерных решений — так можно охарактеризовать запуск Maia 200, нового AI-ускорителя от Microsoft, предназначенного для inference. Этот чип специально создан для сокращения затрат на генерацию токенов и выполнение reasoning задач в крупном масштабе.

    Выход на рынок происходит в ключевой момент: индустрия переходит от обучения к inference, и именно в этом секторе Maia 200 показывает свою силу. Благодаря использованию передовых технологий TSMC 3 нм и наличию свыше 140 миллиардов транзисторов, устройство достигает более 10 петафлопс в FP4 и свыше 5 петафлопс в FP8 — рекордные показатели для таких решений. Это позволило Microsoft повысить эффективность на 30% по сравнению с существующими решениями, превосходя не только собственные системы, но и конкурентные продукты как Amazon Trainium и Google TPU v7.

    Архитектура и дизайн: Hierarchy и Ethernet

    Maia 200 использует иерархическую микроархитектуру, где самые маленькие блоки — тайлы с Tensor и Vector модулями. Каждая часть содержит собственную SRAM и работает в связке с группами тайлов, объединённых шиной DMA и общей памятью. Такой подход обеспечивает высокую утилизацию ресурсов и гибкое управление памятью под разные задачи.

    Движение данных внутри чипа — задача не из простых, для этого применена уникальная сеть на кристалле с выделенными потоками для тензорных и управляющих сообщений. А Ethernet Fabric способен достичь скорости 1.4 ТБ/с, масштабируемой до 6 144 ускорителей, что даёт гигантские возможности для распределённой inference. Это те решения, которые позволяют Microsoft корректно масштабировать работу GPT-5.2 и других моделей, включая работу с гигантскими наборами данных и reinforcement learning.

    Что дальше? Тренды и вызовы

    Переход в inference-ориентированную инфраструктуру — не просто модный тренд, а необходимость для дальнейшего роста производительности. Microsoft показывает, что самые большие инвестиции идут в микросхемы с необычной hierarсhией памяти и масштабируемой Ethernet-сетью. В ближайшие месяцы мы увидим ещё больше решений, которые объединят эффективность и гибкость, а компании, правильно освоившие эти технологии, получат значительное преимущество. Но остаются вопросы: как масштабировать такие решения для гигантских моделей и смогут ли конкуренты догнать лидеров?

    n8n-bot
    31 января 2026, 06:09
    Технологии и разработки

    Читайте также...

    Google Gemini Google Gemini
    Google Gemini — это мощная мультимодальная AI‑модель нового поколения от Google, разработанная для обработки текста, изо...
    Gemini Gemini
    Современный искусственный интеллект, способный генерировать текст, решать сложные задачи и помогать в создании контента....

    Новости new

    Искусственный интеллект помогает создавать мебель по текстовому запросу
    Искусственный интеллект помогает создавать мебель по текстовому запросу
    Новости индустрии ИИ
    16 марта 2026, 15:05
    Как MIT защищает данные пациентов от утечек при помощи ИИ
    Как MIT защищает данные пациентов от утечек при помощи ИИ
    Новости индустрии ИИ
    16 марта 2026, 15:03
    Последние события в мире ИИ: ключевые новости и разработки
    Последние события в мире ИИ: ключевые новости и разработки
    Новости индустрии ИИ
    16 марта 2026, 09:02
    Пять перспективных стартапов получили поддержку в AI-акселераторе Google и Accel India
    Пять перспективных стартапов получили поддержку в AI-акселераторе Google и Accel India
    Новости индустрии ИИ
    16 марта 2026, 03:05
    Выберите обязательные опции

    Мы используем файлы cookie и другие средства сохранения предпочтений и анализа действий посетителей сайта. Подробнее в Согласие на обработку персональных данных. Нажмите «Принять», если даете согласие на это.

    Принять
    IntellectNews

    Вы принимаете условия политики в отношении обработки персональных данных и пользовательского соглашения каждый раз, когда оставляете свои данные в любой форме обратной связи на сайте

    IntellectNews © 2026

    IntellectNews

    Вы принимаете условия политики в отношении обработки персональных данных и пользовательского соглашения каждый раз, когда оставляете свои данные в любой форме обратной связи на сайте, IntellectNews © 2026