IntellectNews
IntellectNews
    IntellectNews
    • Анализ изображений
    • Бизнес-исследования
    • Видео и анимация
    • Генерация и преобразование голоса
    • Генерация изображений
    • Дизайн интерьеров и архитектура
    • Другое
    • Здоровье и благополучие
    • Искусство и креативный дизайн
    • Исследования и анализ данных
    • Маркетинг и реклама
    • Музыка и аудио
    • Написание и редактирование
    • Обнаружение ИИ и антидетекция
    • Образование и перевод
    • Офис и продуктивность
    • Повседневная жизнь
    • Право и финансы
    • Программирование и разработка
    • Социальные сети
    • Управление бизнесом
    • Чат-боты и виртуальные собеседники
    • Новости ИИ
      • Автоматизация
      • Общество и рынок труда
      • ИИ в науке
      • ИИ в развлечениях
      • Персональный ИИ
      • Робототехника и автономные системы
      • Эксперименты и тесты
      • Новости индустрии ИИ
      • Технологии и разработки
      • Применение ИИ
      • Законодательство и этика
    • Блог
    • Промты
      • Business
    Поиск
    Авторизация
    Забыли пароль?
    Регистрация
    • Главная
    • Новости
    • Новости индустрии ИИ
    • Новая методика увеличивает возможности больших языковых моделей

    Новая методика увеличивает возможности больших языковых моделей

    Автоматизация
    Влияние ИИ на общество и рынок труда
    ИИ в науке
    ИИ в развлечениях
    Персональный ИИ и инструменты
    Робототехника и автономные системы
    Эксперименты и тесты
    Новости индустрии ИИ
    Технологии и разработки
    Применение ИИ
    Законодательство и этика
    Новая методика увеличивает возможности больших языковых моделей

    Исследователи из MIT-IBM Watson AI Lab представили новую архитектуру под названием PaTH Attention, которая позволяет большим языковым моделям (LLM) лучше справляться с отслеживанием состояния и последовательным рассуждением в длинных текстах. Это открытие может значительно улучшить работу ИИ в сложных задачах.

    Что такое PaTH Attention?

    PaTH Attention — это новая методика кодирования позиции, которая делает информацию о положении слов адаптивной и зависимой от контекста, в отличие от статического подхода, используемого в RoPE. Вместо фиксированной ротации для каждого слова, как в RoPE, PaTH Attention рассматривает слова как путь, состоящий из небольших трансформаций, зависящих от данных.

    Как это работает?

    Каждая трансформация в PaTH Attention основана на математической операции, называемой отражением Хаусхолдера. Она действует как зеркало, которое подстраивается в зависимости от содержания каждого встречающегося токена. Это позволяет модели учитывать изменения значения на протяжении всего пути между словами, а не только их относительное расстояние.

    Зачем это нужно?

    Большие языковые модели, такие как трансформеры, ограничены в своих возможностях из-за существующих методов внимания. Новая методика позволяет моделям лучше отслеживать изменения состояния и отношения между объектами, что важно для понимания сложных текстов, таких как финансовые документы или художественная литература.

    Новые горизонты для ИИ

    Команда MIT-IBM также изучила, как PaTH Attention может улучшить работу моделей в реальных задачах, таких как моделирование языка и анализ долгих контекстов. Результаты показали, что новая методика превосходит существующие методы как в диагностических тестах, так и в реальных задачах.

    Кроме того, исследователи объединили PaTH Attention с другой методикой — FoX, позволяющей моделям избирательно "забывать" информацию. Это еще больше увеличило эффективность системы.

    Заключение

    Работа MIT-IBM Watson AI Lab открывает новые возможности для улучшения архитектур трансформеров, которые являются основой современных ИИ-систем. Эти исследования подчеркивают важность разработки более выразительных и масштабируемых методов для достижения новых высот в области искусственного интеллекта.

    n8n-bot
    6 марта 2026, 23:54
    Новости индустрии ИИ

    Новости new

    Искусственный интеллект помогает создавать мебель по текстовому запросу
    Искусственный интеллект помогает создавать мебель по текстовому запросу
    Новости индустрии ИИ
    16 марта 2026, 15:05
    Как MIT защищает данные пациентов от утечек при помощи ИИ
    Как MIT защищает данные пациентов от утечек при помощи ИИ
    Новости индустрии ИИ
    16 марта 2026, 15:03
    Последние события в мире ИИ: ключевые новости и разработки
    Последние события в мире ИИ: ключевые новости и разработки
    Новости индустрии ИИ
    16 марта 2026, 09:02
    Пять перспективных стартапов получили поддержку в AI-акселераторе Google и Accel India
    Пять перспективных стартапов получили поддержку в AI-акселераторе Google и Accel India
    Новости индустрии ИИ
    16 марта 2026, 03:05
    Выберите обязательные опции

    Мы используем файлы cookie и другие средства сохранения предпочтений и анализа действий посетителей сайта. Подробнее в Согласие на обработку персональных данных. Нажмите «Принять», если даете согласие на это.

    Принять
    IntellectNews

    Вы принимаете условия политики в отношении обработки персональных данных и пользовательского соглашения каждый раз, когда оставляете свои данные в любой форме обратной связи на сайте

    IntellectNews © 2026

    IntellectNews

    Вы принимаете условия политики в отношении обработки персональных данных и пользовательского соглашения каждый раз, когда оставляете свои данные в любой форме обратной связи на сайте, IntellectNews © 2026