На фоне растущего спроса на автоматизацию медицинской диагностики Google Research анонсировала MedGemma-1.5 — обновлённую модель, ориентированную на работу с реальными клиническими данными. Пока казалось, что ML-решения легко интегрируются в медучреждения, реальность оказалась сложнее: многие системы терпят неудачи из-за недостаточного качества данных или сложности обработки.
Модель MedGemma-1.5 основана на предыдущих версиях, но теперь дополнена возможностью анализа трёхмерных томограмм КТ и МРТ, а также больших слайдовых изображений гистопатологии. Внутренние бенчмарки показывают рост точности выявления болезни: с 58% до 61% в КТ, до 65% в МРТ и почти вдвое улучшились показатели по анализу гистологии — с 0,02 до 0,49. Важный момент — улучшение геометрической локализации на грудных рентгеновских снимках, где точность повысилась с 3% до 38%. Также выросла точность извлечения информации из меддокументов, включая лабораторные отчёты — с 60% до 78% по F1.
Что изменилось в подходе к обработке медицинских изображений
- Обработка трёхмерных данных — теперь модель работает с целыми томограммами, разбивая их на слои и анализируя через подсказки на естественном языке
- Поддержка формата DICOM — Google Cloud предлагает возможность работы с этим стандартом напрямую, без предварительной подготовки данных
- Улучшение работы с анализом текста — новые показатели показывают, что модель становится лучше в ответах на вопросы и подготовке медицинских сводок
В целом, главный тренд — от экспериментов к внедрению. Разработчики понимают, что только комплексный подход с обработкой как изображений, так и текста обеспечивает стабильное качество и применение в реальных клиниках. В ближайшие 12 месяцев можно ожидать дальнейшее повышение точности и расширение функционала — от новых типов изображений до более точных алгоритмов распознавания.
Если раньше медподготовка данных казалась тягостной рутиной, то сейчас индустрия движется к тому, чтобы автоматизировать всё без исключений. Медицинские АИ станут более универсальными, а использование мультимодальных моделей — стандартом.
Что дальше? В будущем модели вроде MedGemma-1.5 должны стать ядром систем поддержки принятия решений, помогают врачам быстрее ставить диагнозы и планировать лечение. Важный вопрос — как обеспечить безопасность данных и соответствие регуляциям, чтобы такие системы смогли полноценно войти в клиники.
