Почему открытие лекарств упирается в масштаб, а не в идеи
Современная фарма работает в условиях почти немыслимого комбинаторного взрыва: потенциально полезных малых органических молекул может быть от 10^20 до 10^60. Даже нижняя граница настолько велика, что проверить все варианты в лаборатории физически невозможно. Это как пытаться прочитать все книги, которые когда-либо могли бы быть написаны, прежде чем выбрать одну для экранизации.
Именно здесь на первый план выходит связка химии и искусственного интеллекта. ИИ не заменяет химика, но помогает резко сузить пространство поиска: от «всех возможных молекул» к «нескольким десяткам кандидатов, которые реально стоит синтезировать и тестировать».

Кейс MIT: как Коннор Коли строит «химически осмысленный» ИИ
Профессор MIT Connor Coley работает на стыке химической инженерии, компьютерных наук и вычислительной химии. Его ключевая идея: модели должны не просто угадывать результат по статистике, а понимать принципы химии, которыми пользуется эксперт.
Это важный сдвиг в философии AI for Science. Ранние модели часто были «черными ящиками»: дали вход, получили ответ. Подход Коли ближе к инженерному: встроить в модель ограничения реального мира, чтобы она ошибалась реже и полезнее в практической лабораторной работе.
От автоматизации синтеза к генеративной химии
Еще в аспирантуре в MIT Коли участвовал в проектах, где машинное обучение применяли для планирования путей синтеза и автоматизации реакций (в том числе в рамках DARPA-программы Make-It). На этой базе позже выросла более амбициозная повестка: не только «как синтезировать известное», но и «как придумать новое».
После постдока в Broad Institute, где он работал с огромными DNA-encoded libraries и задачами связывания с мутантными белками, Коли сформировал в MIT лабораторию с фокусом на двух направлениях:
- Дизайн новых молекул с нужными фарм-свойствами.
- Прогноз и планирование реакций, которые реально приведут к этим молекулам.
Две важные модели: ShEPhERD и FlowER
ShEPhERD: ставка на 3D-геометрию и белок-мишень
Модель ShEPhERD оценивает, насколько потенциальная молекула лекарства подходит для взаимодействия с целевым белком, учитывая пространственную форму. Это критично: в медхимии «подходит по формуле» не значит «подходит по посадке». Аналогия простая, как ключ и замок, но в реальности это гибкая 3D-головоломка с электронными эффектами и конформациями.
По данным MIT, модель уже используется в фармкомпаниях, что само по себе показатель зрелости подхода: инструмент вышел из академической публикации в прикладной контур разработки препаратов.
FlowER: генеративная модель, которая уважает законы химии
В проекте FlowER команда MIT сделала то, чего часто не хватает генеративным системам: встроила фундаментальные ограничения.
- Закон сохранения массы как обязательное условие.
- Проверку реалистичности промежуточных стадий реакции.
- Фокус на механистической правдоподобности, а не только на финальном продукте.
Результат, по наблюдениям исследователей, это повышенная точность предсказаний. Если упростить, модель перестает «фантазировать красиво» и начинает «рассуждать по-химически».

Почему это прорыв: от «угадайки» к научному инструменту
Главный индустриальный смысл работы Коли в том, что ИИ в химии движется от эвристического скоринга к физически и химически обоснованным моделям. Для фармы это означает:
- Меньше ложноположительных кандидатов на ранних этапах.
- Более рациональное планирование экспериментов и снижение затрат на «мокрую» лабораторию.
- Ускорение цикла от гипотезы до синтеза и биотестирования.
По сути, отрасль переходит от массового перебора к инженерному дизайну молекул с поддержкой ИИ.
Что это меняет для ролей в R&D
Распространенный миф: «ИИ заменит химика». Реальность тоньше. Такие системы повышают ценность специалистов, которые умеют формулировать правильные ограничения, проверять механизмы и связывать модельные выводы с экспериментом.
| Было | Становится |
|---|---|
| Ручной отбор кандидатов по ограниченному числу признаков | Многоуровневый AI-скрининг с учетом 3D и механистики |
| Длинные циклы проб и ошибок | Быстрые итерации «модель → синтез → валидация» |
| Фрагментированные команды | Сильная междисциплинарность: химики, ML-инженеры, автоматизация |
Ограничения и открытые вопросы
Даже лучшие модели остаются приближением. Есть несколько системных рисков:
- Сдвиг домена: в реальной лаборатории условия могут отличаться от обучающих данных.
- Качество исходных наборов: «грязные» данные порождают хрупкие прогнозы.
- Интерпретируемость: для регуляторной и промышленной уверенности нужны объяснимые выводы.
Именно поэтому подход «модель + физические ограничения + экспериментальная проверка» сегодня выглядит самым жизнеспособным.

Перспектива на 3–5 лет: куда движется AI-химия
Вероятнее всего, мы увидим усиление четырех трендов:
- Гибридные модели, где статистика объединяется с законами физики и химии.
- Автономные лабораторные циклы: модель сама предлагает следующий лучший эксперимент.
- Интеграция с роботизацией для круглосуточных итераций синтеза.
- Сдвиг в сторону platform pharma, где конкурентное преимущество строится на вычислительном контуре, а не только на библиотеке соединений.
Работа группы Коннора Коли хорошо показывает: настоящий прогресс наступает не тогда, когда ИИ просто «генерирует молекулы», а когда он начинает учитывать причинность химических процессов, как это делает опытный исследователь. Для индустрии это не косметическое улучшение, а смена парадигмы разработки лекарств.
Источник: MIT News (news.mit.edu), материал о работе Connor Coley и его лаборатории на стыке химии и машинного обучения.