Современная химия столкнулась с масштабом, который почти невозможно представить. Среди всех потенциально возможных органических соединений, по оценкам исследователей, от 1020 до 1060 молекул могут теоретически оказаться кандидатами в малые лекарственные препараты. Для сравнения: даже если лаборатория проверяла бы миллионы веществ в день, перебрать такое пространство экспериментально было бы нереально.
Именно здесь на сцену выходит искусственный интеллект в химии. Но речь уже не просто о «быстром переборе» молекул. Новое поколение моделей должно понимать не только статистические закономерности в данных, но и сами химические принципы: форму молекул, механизмы реакций, сохранение массы, энергетическую реализуемость промежуточных стадий.
Один из исследователей, работающих на этой границе, — доцент MIT Коннор Коли, совмещающий химическую инженерию, компьютерные науки и машинное обучение. Его лаборатория разрабатывает модели, которые помогают находить перспективные лекарственные соединения, проектировать новые молекулы и предсказывать, какими путями эти молекулы можно синтезировать.

Почему поиск лекарств так сложен
Малая лекарственная молекула — это не просто набор атомов. Она должна одновременно удовлетворять множеству условий: связываться с нужной белковой мишенью, не разрушаться слишком быстро в организме, не быть токсичной, проходить через биологические барьеры и, что часто забывают, быть реально синтезируемой в лаборатории.
Можно представить химическое пространство как гигантскую библиотеку, где каждая книга — это молекула. Проблема в том, что библиотека больше Вселенной в привычном смысле: почти все «книги» никто никогда не открывал, многие невозможно напечатать, а некоторые выглядят многообещающе только на бумаге.
Классический подход и его ограничения
Традиционно фармацевтические компании используют высокопроизводительный скрининг: берут большие библиотеки соединений и проверяют их на взаимодействие с биологической мишенью. Такой подход эффективен, но дорог и ограничен тем, какие молекулы уже есть в коллекции.
ИИ меняет саму логику поиска: вместо того чтобы проверять только существующие соединения, он может предложить новые молекулы с нужными свойствами. Но здесь возникает ключевой вопрос: как сделать так, чтобы модель не фантазировала химически невозможные структуры?
Коннор Коли и стык химии с машинным обучением
Коли работает в области, которую можно назвать пересечением хемоинформатики, органической химии, машинного обучения и лабораторной автоматизации. Его путь хорошо отражает трансформацию всей науки: будущие открытия всё чаще рождаются не внутри одной дисциплины, а на границах между ними.
Во время работы в MIT над докторской диссертацией он занимался оптимизацией автоматизированных химических реакций и участвовал в программе DARPA Make-It, направленной на использование машинного обучения для улучшения синтеза лекарств и полезных соединений из простых строительных блоков.
Эта идея важна: ИИ должен не только сказать, какая молекула потенциально полезна, но и предложить как её получить. В фармацевтике это критично. Молекула, которую нельзя эффективно синтезировать, остаётся красивой картинкой, а не лекарством.
От распознавания паттернов к химической интуиции
Многие ранние модели в научном ИИ работали как мощные статистические машины. Они находили закономерности в данных, но не всегда понимали физический смысл происходящего. В химии это особенно опасно: модель может предсказать реакцию, которая выглядит правдоподобно по датасету, но нарушает базовые законы или игнорирует механизм.
Лаборатория Коли делает акцент на том, чтобы давать моделям своего рода химическую интуицию. Это не интуиция в человеческом смысле, а набор встроенных ограничений и представлений, которые заставляют ИИ рассуждать ближе к тому, как рассуждает опытный химик.
Аналогия: ИИ как начинающий химик
Представим студента, который запомнил тысячи примеров реакций, но не понимает, почему они происходят. Он может угадывать ответы на знакомых задачах, но быстро ошибётся в новой ситуации. Опытный химик мыслит иначе: он отслеживает движение электронов, оценивает промежуточные стадии, учитывает стерические препятствия и сохранение атомов.
Цель современных моделей — перейти от первого поведения ко второму: не просто «угадывать продукт», а учитывать механизм реакции.

ShEPhERD: генеративная модель с пониманием формы молекул
Одна из разработок лаборатории Коли — модель ShEPhERD. Она оценивает потенциальные лекарственные молекулы с учётом того, как они могут взаимодействовать с белковыми мишенями, особенно через свою трёхмерную форму.
Это принципиально важно, потому что в биохимии форма часто решает всё. Молекула может иметь правильный химический состав, но если она не подходит к активному центру белка, как ключ к замку, терапевтического эффекта не будет.
| Критерий | Почему важен для лекарств |
|---|---|
| 3D-форма | Определяет, сможет ли молекула связаться с белковой мишенью |
| Химические группы | Влияют на растворимость, токсичность и активность |
| Синтезируемость | Показывает, можно ли реально получить соединение |
| Стабильность | Определяет поведение молекулы в организме и при хранении |
По сути, такие модели помогают фармацевтическим исследователям быстрее отсеивать слабые идеи и концентрироваться на соединениях, которые имеют больше шансов пройти путь от компьютерного прогноза до лабораторного эксперимента.
FlowER: прогнозирование химических реакций с физическими ограничениями
Другая важная разработка — генеративная модель FlowER, предназначенная для предсказания продуктов химических реакций. На первый взгляд задача звучит просто: подать на вход реагенты и получить на выходе продукт. Но в реальности химическая реакция — это цепочка событий.
Между исходными веществами и конечным продуктом часто возникают промежуточные состояния. Некоторые из них возможны, другие — нет. Некоторые требуют слишком высокой энергии, другие нарушают базовые принципы. Поэтому команда Коли встроила в модель понимание фундаментальных ограничений, включая закон сохранения массы.
Это похоже на навигатор, который не просто рисует кратчайшую линию между двумя городами, а учитывает дороги, мосты, закрытые участки и рельеф. В химии «дороги» — это механизмы реакций, а «закрытые участки» — физически невозможные превращения.
Почему это повышает точность
- Модель меньше галлюцинирует, потому что не может свободно нарушать химические правила.
- Прогнозы становятся интерпретируемее: исследователь видит не только результат, но и возможный путь.
- ИИ лучше переносится на новые задачи, где данных меньше, но физические принципы остаются теми же.

Что это значит для фармацевтики
Главная ценность таких моделей — не в том, что они полностью заменят химиков. Скорее, они становятся усилителем научной интуиции. Хороший ИИ может предложить тысячи вариантов, подсветить неожиданные направления и предупредить о синтетических тупиках, но финальные решения всё равно требуют экспертизы, экспериментов и клинической проверки.
Для индустрии это означает несколько важных сдвигов.
- Сокращение ранних этапов R&D. Компании смогут быстрее находить стартовые молекулы для дальнейшей оптимизации.
- Переход к дизайну, а не перебору. Исследователи будут не только искать среди готовых библиотек, но и проектировать соединения под конкретные задачи.
- Рост роли автоматизированных лабораторий. Модели будут теснее связываться с роботизированным синтезом и экспериментальной проверкой.
- Более объяснимый научный ИИ. В химии особенно важно понимать, почему модель предлагает именно такой результат.
ИИ в химии: не магия, а новая инженерная дисциплина
Вокруг генеративного ИИ часто возникает ощущение магии: модель «создаёт» текст, изображение или молекулу. Но в научной сфере магии недостаточно. Если ИИ предлагает лекарственное соединение, нужно понимать, почему оно должно работать, можно ли его синтезировать и какие риски оно несёт.
Поэтому направление, в котором работает команда MIT, особенно важно: оно объединяет мощность нейросетей с жёсткостью научных законов. Такая связка может стать основой для нового поколения систем, где ИИ не просто анализирует данные, а участвует в научном цикле: гипотеза, проектирование, синтез, эксперимент, уточнение модели.
Перспективы: от лекарств к новым материалам
Хотя фокус исследований Коли — малые молекулы для лекарств, подход гораздо шире. Органические молекулы используются в материалах, катализаторах, сенсорах, аккумуляторах, полимерах и электронике. Там тоже есть огромные пространства вариантов, которые невозможно перебрать вручную.
В ближайшие годы можно ожидать появления более тесных связок между:
- генеративными моделями, проектирующими молекулы;
- моделями реакций, предлагающими маршруты синтеза;
- роботизированными лабораториями, проверяющими гипотезы;
- активным обучением, где результаты экспериментов сразу улучшают модель.
Это может радикально изменить темп химических исследований. Если раньше один цикл «идея — синтез — проверка» занимал недели или месяцы, то автоматизированные ИИ-лаборатории потенциально смогут проходить такие циклы намного быстрее.
Главный вывод
История исследований Коннора Коли показывает, что будущее ИИ в науке — это не универсальные «чёрные ящики», которые заменяют специалистов. Наоборот, наиболее перспективны модели, которые впитывают структуру конкретной дисциплины: в химии это механизмы реакций, форма молекул, физические законы и опыт синтетиков.
ИИ, понимающий химические принципы, может стать одним из ключевых инструментов в создании лекарств будущего. Он не отменяет лабораторию, но делает её умнее, быстрее и точнее. И, возможно, именно такие системы помогут найти молекулы, которые сегодня скрыты в астрономическом океане химических возможностей.