IntellectNews
IntellectNews
    IntellectNews
    • Анализ изображений
    • Бизнес-исследования
    • Видео и анимация
    • Генерация и преобразование голоса
    • Генерация изображений
    • Дизайн интерьеров и архитектура
    • Другое
    • Здоровье и благополучие
    • Искусство и креативный дизайн
    • Исследования и анализ данных
    • Маркетинг и реклама
    • Музыка и аудио
    • Написание и редактирование
    • Обнаружение ИИ и антидетекция
    • Образование и перевод
    • Офис и продуктивность
    • Повседневная жизнь
    • Право и финансы
    • Программирование и разработка
    • Социальные сети
    • Управление бизнесом
    • Чат-боты и виртуальные собеседники
    • Новости ИИ
      • Автоматизация
      • Общество и рынок труда
      • ИИ в науке
      • ИИ в развлечениях
      • Персональный ИИ
      • Робототехника и автономные системы
      • Эксперименты и тесты
      • Новости индустрии ИИ
      • Технологии и разработки
      • Применение ИИ
      • Законодательство и этика
    • Блог
    • Промты
      • Business
    Поиск
    Авторизация
    Забыли пароль?
    Регистрация
    • Главная
    • Новости
    • Новости индустрии ИИ
    • Новый подход к улучшению возможностей больших языковых моделей

    Новый подход к улучшению возможностей больших языковых моделей

    Автоматизация
    Влияние ИИ на общество и рынок труда
    ИИ в науке
    ИИ в развлечениях
    Персональный ИИ и инструменты
    Робототехника и автономные системы
    Эксперименты и тесты
    Новости индустрии ИИ
    Технологии и разработки
    Применение ИИ
    Законодательство и этика
    Новый подход к улучшению возможностей больших языковых моделей

    Исследователи из MIT-IBM Watson AI Lab представили новую архитектуру, которая увеличивает возможности больших языковых моделей (LLM) в понимании длинных текстов. Этот подход, известный как PaTH Attention, предлагает более точное отслеживание изменений состояния и последовательное рассуждение.

    Проблемы существующих технологий

    Современные модели, такие как RoPE, сталкиваются с ограничениями при работе с изменениями состояния в длинных текстах. Например, если в тексте описывается, как кошка взаимодействует с коробкой, важно учитывать порядок и изменения этих взаимодействий. Однако существующие механизмы внимания часто не справляются с этой задачей.

    Как работает PaTH Attention

    В отличие от RoPE, который фиксирует положение слов на основе их относительного расстояния, PaTH Attention использует адаптивный подход. Он представляет собой путь, состоящий из небольших преобразований, зависящих от данных. Это позволяет модели учитывать изменения значений слов в зависимости от их контекста и последовательности.

    Эти преобразования основаны на математической операции, известной как отражение Хаусхолдера, которая динамически изменяет интерпретацию модели в зависимости от содержания каждого токена. Такой подход позволяет моделям не только учитывать расстояние между словами, но и их текущее значение и изменения.

    Практическое применение и результаты

    Команда исследователей протестировала PaTH Attention на различных задачах, включая синтетические тесты и реальные сценарии. Архитектура показала себя превосходно в задачах, связанных с отслеживанием информации, и превзошла другие методы в тестах на рассуждение.

    Особенно впечатляющими оказались результаты PaTH Attention в задачах с длинным контекстом, где необходимо учитывать тысячи токенов. Модель не только продемонстрировала способность быть «осведомленной» о содержании, но и улучшила метрики производительности, такие как запутанность.

    Будущее и перспективы

    Исследователи также изучили возможность интеграции PaTH Attention с другим методом, известным как Forgetting Transformer (FoX), который позволяет моделям «забывать» менее актуальную информацию. Такой гибридный подход открывает новые горизонты для развития AI-систем.

    Эта работа подчеркивает важность создания новых строительных блоков для AI, которые могут применяться в различных областях, таких как биология, анализ белков и ДНК. В будущем такие исследования могут оказать значительное влияние на развитие искусственного интеллекта.

    n8n-bot
    6 марта 2026, 23:55
    Новости индустрии ИИ

    Новости new

    Искусственный интеллект помогает создавать мебель по текстовому запросу
    Искусственный интеллект помогает создавать мебель по текстовому запросу
    Новости индустрии ИИ
    16 марта 2026, 15:05
    Как MIT защищает данные пациентов от утечек при помощи ИИ
    Как MIT защищает данные пациентов от утечек при помощи ИИ
    Новости индустрии ИИ
    16 марта 2026, 15:03
    Последние события в мире ИИ: ключевые новости и разработки
    Последние события в мире ИИ: ключевые новости и разработки
    Новости индустрии ИИ
    16 марта 2026, 09:02
    Пять перспективных стартапов получили поддержку в AI-акселераторе Google и Accel India
    Пять перспективных стартапов получили поддержку в AI-акселераторе Google и Accel India
    Новости индустрии ИИ
    16 марта 2026, 03:05
    Выберите обязательные опции

    Мы используем файлы cookie и другие средства сохранения предпочтений и анализа действий посетителей сайта. Подробнее в Согласие на обработку персональных данных. Нажмите «Принять», если даете согласие на это.

    Принять
    IntellectNews

    Вы принимаете условия политики в отношении обработки персональных данных и пользовательского соглашения каждый раз, когда оставляете свои данные в любой форме обратной связи на сайте

    IntellectNews © 2026

    IntellectNews

    Вы принимаете условия политики в отношении обработки персональных данных и пользовательского соглашения каждый раз, когда оставляете свои данные в любой форме обратной связи на сайте, IntellectNews © 2026