IntellectNews
IntellectNews
    IntellectNews
    • Анализ изображений
    • Бизнес-исследования
    • Видео и анимация
    • Генерация и преобразование голоса
    • Генерация изображений
    • Дизайн интерьеров и архитектура
    • Другое
    • Здоровье и благополучие
    • Искусство и креативный дизайн
    • Исследования и анализ данных
    • Маркетинг и реклама
    • Музыка и аудио
    • Написание и редактирование
    • Обнаружение ИИ и антидетекция
    • Образование и перевод
    • Офис и продуктивность
    • Повседневная жизнь
    • Право и финансы
    • Программирование и разработка
    • Социальные сети
    • Управление бизнесом
    • Чат-боты и виртуальные собеседники
    • Новости ИИ
      • Автоматизация
      • Общество и рынок труда
      • ИИ в науке
      • ИИ в развлечениях
      • Персональный ИИ
      • Робототехника и автономные системы
      • Эксперименты и тесты
      • Новости индустрии ИИ
      • Технологии и разработки
      • Применение ИИ
      • Законодательство и этика
    • Блог
    • Промты
      • Business
    Поиск
    Авторизация
    Забыли пароль?
    Регистрация
    • Главная
    • Новости
    • Технологии и разработки
    • DeepSeek применяет матрицу 1967 года для стабилизации гиперсвязей в больших моделях

    Новые методы стабилизации гиперсвязей в масштабных языковых моделях

    Автоматизация
    Влияние ИИ на общество и рынок труда
    ИИ в науке
    ИИ в развлечениях
    Персональный ИИ и инструменты
    Робототехника и автономные системы
    Эксперименты и тесты
    Новости индустрии ИИ
    Технологии и разработки
    Применение ИИ
    Законодательство и этика
    Новые методы стабилизации гиперсвязей в масштабных языковых моделях
    Наука и искусственный интеллект: новые подходы к стабильности моделей

    В эпоху масштабных языковых моделей возникает новая проблема: гиперсвязи, расширяющие остаточные потоки, могут привести к числовой нестабильности, увеличивая гейн до 3000 и вызывая сбои в обучении. Исследователи заметили, что устаревший алгоритм нормализации из 1967 года, известный как алгоритм Sinkhorn-Knopp, помогает ограничить эти росты, удерживая гейн около 1.6. Для этого разработали метод под названием Manifold Constrained Hyper Connections (mHC), который использует итерации по нормализации строк и столбцов для достижения почти doubly stochastic матриц, удерживая параметры в зоне стабильности.

    Почему именно этот алгоритм сработал

    Традиционные гиперсвязи в архитектурах типа Transformers использовали простые residual соединения, где сигнал усиливается или ослабляется по мере глубины. Но увеличение числа потоков увеличивает экспоненциальный эффект микшеров, что ведёт к взрывной стабилизации или исчезновению градиентов. Вмешательство алгоритма из 1967 года, основанное на итерационных нормализациях, ограничивает эти эффекты, оставляя параметры в виде вероятностных матриц, что легко интерпретировать и контролировать.

    Ежедневная практика и оптимизация

    Для внедрения в масштабное обучение researchers использовали оптимизированные ядра, активностное чекпойнтинг и pipelining, сокращая накладные расходы примерно до 6.7% по сравнению с обычными архитектурами. Несмотря на добавочную нагрузку, качество обучения заметно выросло, а показатели на бенчмарках — BBH, DROP, GSM8K и др. — улучшились как в точности, так и в стабильности.

    Что дальше — взгляд в будущее

    В ближайшие месяцы ожидается, что подобные манипуляции с матрицами станут стандартом для контроля роста стабилизации в моделях, а подход с метрическими ограничениями распространится на другие архитектурные компоненты. В результате разработчики смогут создавать ещё более глубокие и стабильные модели без риска нестабильности. Вопрос — как масштабировать эти методы для триллионных параметров, остаётся открытым, но уже сейчас ясно: проектирование гиперсвязей по строгим манлоидным законам — путь к неубиваемым моделям будущего.

    n8n-bot
    4 января 2026, 06:01
    Технологии и разработки

    Читайте также...

    DeepSeek DeepSeek
    ChatGPT is a free-to-use AI system designed for engaging conversations, gaining insights, automating tasks, and explorin...

    Новости new

    Искусственный интеллект помогает создавать мебель по текстовому запросу
    Искусственный интеллект помогает создавать мебель по текстовому запросу
    Новости индустрии ИИ
    16 марта 2026, 15:05
    Как MIT защищает данные пациентов от утечек при помощи ИИ
    Как MIT защищает данные пациентов от утечек при помощи ИИ
    Новости индустрии ИИ
    16 марта 2026, 15:03
    Последние события в мире ИИ: ключевые новости и разработки
    Последние события в мире ИИ: ключевые новости и разработки
    Новости индустрии ИИ
    16 марта 2026, 09:02
    Пять перспективных стартапов получили поддержку в AI-акселераторе Google и Accel India
    Пять перспективных стартапов получили поддержку в AI-акселераторе Google и Accel India
    Новости индустрии ИИ
    16 марта 2026, 03:05
    Выберите обязательные опции

    Мы используем файлы cookie и другие средства сохранения предпочтений и анализа действий посетителей сайта. Подробнее в Согласие на обработку персональных данных. Нажмите «Принять», если даете согласие на это.

    Принять
    IntellectNews

    Вы принимаете условия политики в отношении обработки персональных данных и пользовательского соглашения каждый раз, когда оставляете свои данные в любой форме обратной связи на сайте

    IntellectNews © 2026

    IntellectNews

    Вы принимаете условия политики в отношении обработки персональных данных и пользовательского соглашения каждый раз, когда оставляете свои данные в любой форме обратной связи на сайте, IntellectNews © 2026