Black Forest Labs анонсировала выпуск FLUX.2 [klein], семейства компактных моделей для интерактивного визуального интеллекта, созданных для запуска на потребительском оборудовании. Эти модели позволяют генерировать и редактировать изображения менее чем за секунду, объединяя функции text-to-image и image-to-image в единой архитектуре.
Ранее компания предлагала FLUX.2 [dev] — трансформер с 32 миллиардами параметров, ориентированный на качество и гибкость, требующий сотен гигабайт VRAM. Теперь малыши — FLUX.2 [klein] с 4 и 9 миллиардами параметров — обеспечивают быструю реакцию и подходят для обычных GPU, таких как RTX 3090 и 4070, с временем отклика около 0,3-1,2 секунд.
Основные модели и отличия
- Фамилия включают четыре варианта: 4B, 9B, 4B Base и 9B Base.
- Модели 4B и 9B используют четыре шага вывода и guidance distillation — для быстрого реагирования и поддержки производительности в режиме реального времени.
- 9B сочетается с Qwen3 для обработки текста и — считается флагманом, балансирующим качество и задержку для разнообразных задач.
- Base-версии — разработки для доработки, экспериментов и кастомизации, с более длинными графиками выборки.
Все модели умеют создавать изображения из описаний, редактировать и комбинировать несколько ссылок, что важно для творческих задач и профессиональных решений. Производительность зависит от модели и железа: 4B работает в среднем за 0,3-1,2 секунды, используя до 13 ГБ VRAM, а 9B требует около 29 ГБ — под RTX 4090.
Для широкой интеграции доступны квантованные версии FP8 и NVFP4 с ускорением до 2,7 раза и уменьшением потребления VRAM до 55%. Эти новинки позволяют запускать мощные мультитаск-архитектуры внутри одного компактного решения.
Что показывают benchmark
На тестах FLUX.2 [klein] показывает лучший баланс между качеством и скоростью среди аналогичных моделей, опережая Qwen и Z Image. Они становятся нащупываемой точкой на кривой Pareto — оптимальный компромисс для разработчиков и компаний, ищущих максимум при минимальных затратах.
Текущее направление индустрии — это быстрое внедрение мощных, лёгких и универсальных моделей, пригодных для домашнего и коммерческого использования. В ближайшие месяцы ждем появления ещё более оптимизированных версий и расширения функциональности. Те, кто умеют правильно сочетать скорость и качество — выигрывают.
Рынок движется в сторону массовых решений — с единым API, поддержкой многофункциональных задач и ускорением на базе NVIDIA. отражая тенденцию к democratization & democratization, где каждому доступен мощный визуальный ИИ в два клика — и всё это в рамках привычных домашних ПК.
Пока индустрия учится балансировать между точностью и скоростью, важнейший вопрос — как масштабировать такие решения до миллиона изображений без потерь или задержек. На этом этапе ближайшее будущее — интеграция адаптивных систем мониторинга и автоматизации.
