В фармацевтике давно известен парадокс: потенциально полезных молекул невероятно много, а времени и ресурсов на их проверку катастрофически мало. По оценкам, число кандидатов на роль малых лекарственных молекул может лежать в диапазоне от 1020 до 1060. Для сравнения, это как пытаться вручную перебрать все возможные песчинки на тысячах планет.
На этом фоне работа команды MIT под руководством Коннора Коли (Connor Coley) выглядит как переход от «грубой силы» к «инженерному интеллекту»: вместо слепого перебора модели учатся учитывать механизмы реакций, трехмерную геометрию молекул и физические ограничения, которые химику кажутся очевидными.

Почему классический поиск лекарств упирается в потолок
Традиционный drug discovery десятилетиями строился на длинной цепочке гипотез, синтеза и лабораторной проверки. Этот подход работает, но медленно и дорого. Главная проблема в том, что даже очень опытная команда физически не может протестировать астрономическое количество вариантов.
Именно поэтому сегодня на первый план выходит вычислительная химия + машинное обучение. Но важный нюанс: ранние модели часто работали как «черные ящики», выдавая результат без объяснимой химической логики. Для науки и фармы этого недостаточно, потому что ошибка в предсказании здесь означает потерю месяцев работы и миллионов долларов.
Подход Коннора Коли: на стыке химической инженерии и ИИ
Коли работает на пересечении химии и компьютерных наук в MIT (Chemical Engineering, EECS и MIT Schwarzman College of Computing). Его ключевая идея проста и сильна: ИИ-модель должна мыслить ближе к химику, а не только к статистике.
Еще во время PhD в MIT он занимался оптимизацией автоматизированных реакций, планированием путей синтеза и cheminformatics (вычислительным анализом химических данных), в том числе в рамках программы DARPA Make-It. Этот опыт сформировал его текущую стратегию: не просто ускорять синтез известных соединений, а проектировать новые молекулы и новые пути их получения.
Аналогия «навигатор против опытного водителя»
Обычная ИИ-модель похожа на навигатор, который знает статистику пробок, но не понимает, что мост закрыт на ремонт. Подход Коли ближе к опытному водителю: система знает не только вероятный маршрут, но и физические ограничения дороги. В химии роль «закрытого моста» играют законы сохранения массы, нестабильные промежуточные состояния и невозможные механистические шаги.

ShEPhERD и FlowER: чем они важны индустрии
ShEPhERD: геометрия как язык взаимодействия лекарства и белка
Модель ShEPhERD обучена оценивать кандидаты в лекарства по тому, как их 3D-форма соотносится с целевыми белками. Это критично: в биологии «подходит» не только химическая формула, но и пространственная посадка, как у ключа и замка.
По сути, команда добавляет в генеративный процесс интуицию медицинской химии: модель не просто генерирует «что-то похожее», а учитывает критерии, которыми пользуются практикующие medicinal chemists. Показательно, что инструмент уже используется фармкомпаниями.
FlowER: предсказание продуктов реакции с учетом физики
Вторая важная разработка, FlowER, предсказывает продукты реакций при комбинации различных реагентов. Ключевое отличие от типичных подходов в том, что в модель встроены базовые принципы, включая закон сохранения массы, а также проверка правдоподобности промежуточных стадий.
Результат: ограничения не «мешают творчеству» модели, а наоборот, повышают точность. Это важный урок для всего AI for Science: если правильно встроить доменную физику, качество предсказаний растет.
Что это меняет для фармы и химической индустрии
- Снижение стоимости раннего отбора: меньше тупиковых экспериментов в «мокрой» лаборатории.
- Ускорение цикла гипотеза → проверка: команды быстрее выходят на жизнеспособные серии соединений.
- Рост роли автоматизации: синтез, планирование экспериментов и анализ данных все больше связаны в единый контур.
- Сдвиг компетенций: ценность получают специалисты, которые понимают и химию, и ML-пайплайны.
Сравнение подходов: «черный ящик» vs «химически обоснованный ИИ»
| Критерий | Черный ящик | Химически обоснованный ИИ |
|---|---|---|
| Интерпретируемость | Низкая | Выше за счет механистических ограничений |
| Надежность вне обучающего набора | Часто нестабильна | Лучше переносится на новые случаи |
| Практическая ценность для синтеза | Ограничена | Выше, ближе к реальным лабораторным условиям |
| Риск физически невозможных предсказаний | Высокий | Снижен за счет встроенных законов |

Ограничения и честный взгляд на перспективы
Важно не впадать в технооптимизм. Даже лучшие модели пока не заменяют эксперимент: они сужают пространство поиска, но не дают окончательной истины. Реальная биологическая активность зависит от множества факторов, включая токсикологию, метаболизм и свойства, которые трудно полноценно предсказать заранее.
Кроме того, отрасль сталкивается с вопросами качества данных, воспроизводимости и интеграции AI-инструментов в регуляторные процессы. Однако тренд уже очевиден: будущее за гибридным контуром, где ИИ и химик работают как единая система принятия решений.
Почему кейс MIT важен шире, чем одна лаборатория
История Коннора Коли показывает, что прорывы происходят там, где стираются границы между дисциплинами. MIT в этом смысле выступает моделью экосистемы: сильная химия, сильный computer science-блок, развитая культура коллаборации и быстрый перенос методов в индустрию.
Для рынка это сигнал: следующая волна конкурентных преимуществ в фарме будет строиться не только на доступе к данным, но и на способности «вшивать» в ИИ научное понимание предметной области. Проще говоря, побеждать будут не те, у кого просто больше GPU, а те, у кого лучше связаны алгоритмы, химическая интуиция и лабораторная инфраструктура.
Вывод
Материал MIT News о работе Коннора Коли фиксирует важный сдвиг: ИИ в химии взрослеет. От статистического угадывания отрасль идет к моделям, которые учитывают законы природы и логику реакционных механизмов. Это делает прогнозы полезнее для реальной науки и ближе к требованиям фармацевтической разработки. Если тенденция сохранится, ближайшие годы могут стать периодом, когда «умный дизайн молекул» станет стандартом, а не экспериментом передовой лаборатории.
Источник: MIT News, “Building AI models that understand chemical principles”, 20 May 2026.