IntellectNews
IntellectNews
    IntellectNews
    • Анализ изображений
    • Бизнес-исследования
    • Видео и анимация
    • Генерация и преобразование голоса
    • Генерация изображений
    • Дизайн интерьеров и архитектура
    • Другое
    • Здоровье и благополучие
    • Искусство и креативный дизайн
    • Исследования и анализ данных
    • Маркетинг и реклама
    • Музыка и аудио
    • Написание и редактирование
    • Обнаружение ИИ и антидетекция
    • Образование и перевод
    • Офис и продуктивность
    • Повседневная жизнь
    • Право и финансы
    • Программирование и разработка
    • Социальные сети
    • Управление бизнесом
    • Чат-боты и виртуальные собеседники
    • Новости ИИ
      • Автоматизация
      • Общество и рынок труда
      • ИИ в науке
      • ИИ в развлечениях
      • Персональный ИИ
      • Робототехника и автономные системы
      • Эксперименты и тесты
      • Новости индустрии ИИ
      • Технологии и разработки
      • Применение ИИ
      • Законодательство и этика
    • Блог
    • Промты
      • Business
    Поиск
    Авторизация
    Забыли пароль?
    Регистрация
    • Главная
    • Новости
    • Эксперименты и тесты
    • LLaMA 3 улучшили без переобучения

    ASTRO усилил reasoning-мощности LLaMA 3 без переобучения

    Автоматизация
    Влияние ИИ на общество и рынок труда
    ИИ в науке
    ИИ в развлечениях
    Персональный ИИ и инструменты
    Робототехника и автономные системы
    Эксперименты и тесты
    Новости индустрии ИИ
    Технологии и разработки
    Применение ИИ
    Законодательство и этика
     ASTRO усилил reasoning-мощности LLaMA 3 без переобучения

    Исследователи представили новую методику дообучения языковой модели LLaMA 3, позволяющую существенно улучшить её способности к рассуждению без изменения архитектуры.

    Команда специалистов из нескольких исследовательских институтов разработала технику пост-тренировочной адаптации под названием ASTRO (Alignment Scaffolding for Text Reasoning Optimization), которая позволила добиться значительного повышения качества работы модели LLaMA 3-8B на стандартных бенчмарках.

    Метод ASTRO направлен на улучшение логических и аналитических способностей модели, при этом не требует вмешательства в основную архитектуру или проведение дорогостоящего предобучения. Вместо этого применяются дополнительные этапы инструкционного дообучения, специально ориентированные на улучшение reasoning-задач.

    По данным разработчиков, использование ASTRO привело к увеличению производительности модели от 16% до 20% на популярных тестах, включая MATH, GPQA, ProofWriter и другие. Особенно заметны улучшения в задачах, связанных с математическими доказательствами и научным анализом.

    Исследователи подчёркивают, что ключевым элементом ASTRO является структурирование инструкций, стимулирующее пошаговое логическое мышление. Модель обучается объяснять своё мышление и давать обоснования, а не просто выдавать результат.

    Авторы подхода отмечают, что такой формат посттренировочного обучения может стать важным инструментом для повышения интеллектуальных возможностей уже существующих языковых моделей, особенно при ограничениях на вычислительные ресурсы или при работе с открытыми моделями, как LLaMA 3.

    В перспективе подобные методы могут применяться для адаптации моделей к специализированным задачам в научной, образовательной или инженерной среде без необходимости масштабного переобучения.

    7 июля 2025, 17:25
    Эксперименты и тесты

    Новости new

    Как подготовка данных меняет будущее безопасного ИИ: новые исследования и перспективы
    Как подготовка данных меняет будущее безопасного ИИ: новые исследования и перспективы
    Технологии и разработки
    20 января 2026, 07:16
    Что Kickstarter учит нас о завершении целей: неожиданные уроки успеха и провала
    Что Kickstarter учит нас о завершении целей: неожиданные уроки успеха и провала
    Технологии и разработки
    20 января 2026, 07:15
    Как повышенный уровень CO2 может влиять на когнитивные функции: новые исследования и практические идеи
    Как повышенный уровень CO2 может влиять на когнитивные функции: новые исследования и практические идеи
    Технологии и разработки
    20 января 2026, 07:12
    Как графовые нейросети меняют подход к прогнозированию спроса в логистике
    Как графовые нейросети меняют подход к прогнозированию спроса в логистике
    Технологии и разработки
    20 января 2026, 06:34
    Выберите обязательные опции

    Мы используем файлы cookie и другие средства сохранения предпочтений и анализа действий посетителей сайта. Подробнее в Согласие на обработку персональных данных. Нажмите «Принять», если даете согласие на это.

    Принять
    IntellectNews

    Вы принимаете условия политики в отношении обработки персональных данных и пользовательского соглашения каждый раз, когда оставляете свои данные в любой форме обратной связи на сайте

    IntellectNews © 2026

    IntellectNews

    Вы принимаете условия политики в отношении обработки персональных данных и пользовательского соглашения каждый раз, когда оставляете свои данные в любой форме обратной связи на сайте, IntellectNews © 2026