Почему классический поиск лекарств упирается в масштаб
В современной фармацевтике главная проблема не в нехватке идей, а в чрезмерном количестве вариантов. По оценкам исследователей, потенциально полезных малых молекул может быть от 1020 до 1060. Даже нижняя граница настолько велика, что экспериментальный перебор становится практически невозможным.
Именно здесь на сцену выходит искусственный интеллект: не как «магическая кнопка», а как инструмент отбора, который помогает химикам быстрее понять, какие молекулы стоит синтезировать и тестировать в первую очередь.

Кто и как двигает это направление: кейс Коннора Коли (MIT)
Профессор MIT Connor Coley работает на стыке химической инженерии, computer science и машинного обучения. Его команда строит вычислительные модели, которые решают три ключевые задачи:
- анализируют огромные пространства химических соединений;
- проектируют новые молекулы с нужными свойствами;
- предсказывают пути синтеза (reaction pathways), по которым эти молекулы можно получить в лаборатории.
Важно, что этот подход не ограничен только фармой. Он применим ко многим органическим молекулам, но поиск малых лекарственных молекул сегодня остается главным фокусом из-за высокой практической ценности.
От биографии к методологии
Коли пришел в эту область через инженерную химию и вычислительные методы: от ранней работы с белковыми структурами до проектов DARPA по автоматизации синтеза. Этот путь сформировал важный принцип: сильная химическая модель должна не просто «угадывать», а рассуждать в терминах химии.
От «черного ящика» к химической интуиции моделей
Обычная нейросеть может показывать неплохую точность, но без физико-химических ограничений она часто предлагает красивые, но нереалистичные решения. В химии это критично: ошибка в механизме реакции означает потерю времени, реагентов и денег.
Команда MIT делает ставку на индуктивные ограничения: модель должна учитывать реальные законы и этапность процесса, как это делает опытный химик.
ShEPhERD: 3D-логика взаимодействия молекулы и белка
Модель ShEPhERD оценивает перспективные лекарственные молекулы с учетом их трехмерной формы и вероятного взаимодействия с целевыми белками. Это приближает генеративный ИИ к практике medicinal chemistry: важна не просто структура «на бумаге», а то, как она ведет себя в пространстве.
По данным MIT, подход уже используется фармкомпаниями, что показывает зрелость технологии: это не только академический эксперимент, но и рабочий индустриальный инструмент.
FlowER: предсказание продуктов реакции с учетом физики
В проекте FlowER исследователи встроили в генеративную модель фундаментальные принципы, включая закон сохранения массы, и заставили систему учитывать реализуемость промежуточных стадий реакции.
Аналогия простая: если обычная модель похожа на человека, который пытается угадать финал фильма по постеру, то модель с механистическими ограничениями смотрит весь сюжет по сценам и проверяет, что каждая сцена логически возможна.

Почему это работает лучше: инженерный взгляд
| Подход | Сильная сторона | Главное ограничение |
|---|---|---|
| Чисто data-driven модель | Быстро обучается на больших датасетах | Может предлагать химически сомнительные решения |
| Модель с физико-химическими ограничениями | Выше реалистичность и переносимость в лабораторию | Сложнее проектирование и обучение |
| Гибридный pipeline (ИИ + эксперт-химик) | Лучший баланс скорости и надежности | Требует междисциплинарной команды |
Главный вывод: в химии выигрывает не тот ИИ, который «самый креативный», а тот, который сохраняет научную дисциплину в генерации гипотез.
Что это меняет для индустрии прямо сейчас
- Сокращение цикла discovery. Ранний этап отбора молекул становится быстрее, а «мусорных» гипотез меньше.
- Переход к программируемой химии. Реакции, дизайн молекул и автоматизация лабораторий постепенно связываются в единый цифровой контур.
- Рост роли вычислительной валидации. До «мокрой» лаборатории доходит меньше, но более качественных кандидатов.
- Новый спрос на кадры. Компании ищут гибридные профили: химия + ML + инженерия эксперимента.

Ограничения и трезвый прогноз
Даже самые сильные модели пока не отменяют биологическую сложность. Точная реакция in silico не гарантирует эффективность и безопасность препарата в организме. Кроме того, качество вывода упирается в качество данных, а в химии исторические датасеты часто неоднородны и смещены.
Тем не менее тренд устойчив: мы движемся от «ИИ как фильтра» к ИИ как научному соавтору, который умеет предлагать осмысленные молекулярные гипотезы и объяснимые пути синтеза.
Почему кейс MIT важен шире одной лаборатории
История Коннора Коли показывает, что прорывы возникают там, где есть междисциплинарная среда: химики, ML-исследователи, инженеры автоматизации и фарм-эксперты работают в одном контуре. Это модель будущей R&D-инфраструктуры, где алгоритм и эксперимент не конкурируют, а усиливают друг друга.
Для рынка это означает одно: следующая волна преимуществ в drug discovery будет строиться не вокруг «больших моделей вообще», а вокруг доменно грамотных моделей, которые понимают законы предметной области.
Итог
Работы MIT в направлении ShEPhERD и FlowER демонстрируют ключевой сдвиг: эффективный ИИ в химии должен думать не только статистикой, но и механизмами. Именно это превращает генерацию молекул из красивой демонстрации в инструмент, способный реально ускорять создание новых лекарств.
Источник: MIT News, “Building AI models that understand chemical principles”, 20 мая 2026.