В научном мире создание иллюстраций для статей долгое и трудоемкое. Хотя ИИ уже умеет делать литературные обзоры и писать код, визуально донести сложные открытия — всё еще проблема. Индустрия столкнулась с парадоксом: обещания автоматизации расходятся с реальностью. Взято, например, PaperBanana от Google — новая многоагентная система, которая обещает изменить подход к подготовке иллюстраций.
PaperBanana объединяет пять специализированных агентов:
- Retriever: ищет лучшие примеры для стиля и структуры
- Planner: превращает текст методологии в описание для графиков
- Stylist: выбирает цветовые палитры и дизайн, соответствующие конференции NeurIPS
- Visualizer: превращает описание в визуал
- Critic: проверяет итоговую картинку на точность и эстетичность
На базе данных из тестовых случаев NeurIPS 2025 PaperBanana показывает +17% в общем качестве, +37% в лаконичности и +13% в читаемости. Для графиков — комбинацией кода и визуальных моделей достигается точность и красота. При этом стиль адаптируется под исследовательские области: для теорий и оптимизаций — минимализм, для диаграмм в компьютер vision — геометрия и пространство. В чем особенность? Проще говоря, система делит работу: сначала ищет лучшие примеры и идеи, а потом формирует финальные иллюстрации — с минимальными ошибками и максимальной точностью. Через год такие подходы станут индустриальным стандартом, ведь качество и скорость растут, а ручная работа отходить на второй план. В результате — ускорение публикаций и повышение их уровня.

