В последние месяцы интернет не отводит взгляд от новых фотореалистичных 3D-фигурок и странных изображений, создаваемых моделью Nano Banana.
Этот проект, изначально известный как кодовое имя на сайте LMArena, стал символом важнейшего технологического этапа в области AI-изображений.
В чем тут суть?
В отличие от привычных Diffusion Models, таких как Stable Diffusion и Midjourney, Nano Banana использует другую архитектуру, которая пока держится в секрете. Но уже понятно, что она позволяет Google добиться сверхреалистичных и логически последовательных изображений, что раньше было трудной задачей.
Что за революция?
Модель показывает, что можно создавать не просто красивые картинки, а такие, что с ними невозможно поспорить — они выглядят живыми и логичными. Это прорыв для AI-арта, который долго мучился вопросами с логикой и качеством.
Что дальше?
Индустрия движется в сторону формирования более мощных и отзывчивых моделей, способных работать с реальной логикой и деталями. В ближайшие 12 месяцев мы увидим еще больше таких решений, а старые Diffusion модели потихоньку уйдут на второй план.
Компании, которые смогут быстро адаптировать новые алгоритмы, займут ведущие позиции. Те, кто продолжат полагаться только на старые подходы, рискуют остаться позади.
