IntellectNews
IntellectNews
    IntellectNews
    • Анализ изображений
    • Бизнес-исследования
    • Видео и анимация
    • Генерация и преобразование голоса
    • Генерация изображений
    • Дизайн интерьеров и архитектура
    • Другое
    • Здоровье и благополучие
    • Искусство и креативный дизайн
    • Исследования и анализ данных
    • Маркетинг и реклама
    • Музыка и аудио
    • Написание и редактирование
    • Обнаружение ИИ и антидетекция
    • Образование и перевод
    • Офис и продуктивность
    • Повседневная жизнь
    • Право и финансы
    • Программирование и разработка
    • Социальные сети
    • Управление бизнесом
    • Чат-боты и виртуальные собеседники
    • Новости ИИ
      • Автоматизация
      • Общество и рынок труда
      • ИИ в науке
      • ИИ в развлечениях
      • Персональный ИИ
      • Робототехника и автономные системы
      • Эксперименты и тесты
      • Новости индустрии ИИ
      • Технологии и разработки
      • Применение ИИ
      • Законодательство и этика
    • Блог
    • Промты
      • Business
    Поиск
    Авторизация
    Забыли пароль?
    Регистрация
    • Главная
    • Новости
    • Технологии и разработки
    • SmallThinker: LLM для локального запуска

    SmallThinker — эффективные LLM для локального запуска на обычном CPU

    Автоматизация
    Влияние ИИ на общество и рынок труда
    ИИ в науке
    ИИ в развлечениях
    Персональный ИИ и инструменты
    Робототехника и автономные системы
    Эксперименты и тесты
    Новости индустрии ИИ
    Технологии и разработки
    Применение ИИ
    Законодательство и этика
     SmallThinker — эффективные LLM для локального запуска на обычном CPU

    SmallThinker — LLM нового поколения для локального запуска

    Представьте, что полноценная «большая» языковая модель может работать прямо на вашем ноутбуке без бешеных затрат на облако. Звучит невероятно? Знакомьтесь с SmallThinker — семейством LLM, созданных с нуля для экономного и эффективного локального использования.

    Вместо того чтобы сжимать громоздкие облачные модели, разработчики проектируют SmallThinker, учитывая слабые CPU, ограниченную память и медленный диск. Первое ключевое решение — двухуровневая разреженная структура: тонконастроенный Mixture-of-Experts (MoE) внутри и разреженные FFN, что снижает нагрузку на вычисления без потери мощности.

    Но и это ещё не всё. Чтобы обойти «узкое горло» хранения, внутри движка предусмотрен предаутентификационный маршрутизатор: во время расчёта внимания система заранее подгружает параметры экспертов, маскируя задержки чтения с диска. А для экономии памяти используется гибридный механизм NoPE-RoPE, который сокращает объём кеша ключей и значений.

    В итоге младшая версия SmallThinker (4 млрд параметров) при квантизации Q4_0 выдаёт свыше 20 токенов в секунду на обычном процессоре, потребляя около 1 ГБ ОЗУ. Более крупная модель (21 млрд параметров) работает на том же CPU со скоростью свыше 20 токенов/с и укладывается в 8 ГБ памяти. Никаких дорогих GPU не требуется!

    SmallThinker уже доступен для скачивания и экспериментов: версии для инструкционных задач выложены на Hugging Face. Готовы ли вы испытать ИИ нового уровня прямо на своём устройстве?

    1 августа 2025, 11:10
    Технологии и разработки

    Связанные ИИ

    Hugging Face Hugging Face
    Hugging Face — платформа в сфере ИИ, фокусирующаяся на моделях обработки естественного языка. Она предоставляет репозито...
    NVIDIA NVIDIA
    NVIDIA – это ведущая компания в области вычислений на основе искусственного интеллекта, разрабатывающая графические проц...

    Новости new

    Искусственный интеллект помогает создавать мебель по текстовому запросу
    Искусственный интеллект помогает создавать мебель по текстовому запросу
    Новости индустрии ИИ
    16 марта 2026, 15:05
    Как MIT защищает данные пациентов от утечек при помощи ИИ
    Как MIT защищает данные пациентов от утечек при помощи ИИ
    Новости индустрии ИИ
    16 марта 2026, 15:03
    Последние события в мире ИИ: ключевые новости и разработки
    Последние события в мире ИИ: ключевые новости и разработки
    Новости индустрии ИИ
    16 марта 2026, 09:02
    Пять перспективных стартапов получили поддержку в AI-акселераторе Google и Accel India
    Пять перспективных стартапов получили поддержку в AI-акселераторе Google и Accel India
    Новости индустрии ИИ
    16 марта 2026, 03:05
    Выберите обязательные опции

    Мы используем файлы cookie и другие средства сохранения предпочтений и анализа действий посетителей сайта. Подробнее в Согласие на обработку персональных данных. Нажмите «Принять», если даете согласие на это.

    Принять
    IntellectNews

    Вы принимаете условия политики в отношении обработки персональных данных и пользовательского соглашения каждый раз, когда оставляете свои данные в любой форме обратной связи на сайте

    IntellectNews © 2026

    IntellectNews

    Вы принимаете условия политики в отношении обработки персональных данных и пользовательского соглашения каждый раз, когда оставляете свои данные в любой форме обратной связи на сайте, IntellectNews © 2026