В химии существует почти невероятное число молекул, которые теоретически могут стать лекарствами: оценки доходят до диапазона от 1020 до 1060. Проверить их вручную в лаборатории невозможно даже за многие десятилетия. Поэтому исследователи все активнее используют искусственный интеллект, чтобы заранее отбирать наиболее перспективные варианты.
Именно на этом направлении работает профессор MIT Коннор Коли. Его команда находится на стыке химии, инженерии и computer science: они создают модели, которые анализируют огромные наборы соединений, предлагают новые структуры молекул и прогнозируют, через какие реакции их можно синтезировать.
ИИ для химии, а не просто генерация «красивых» молекул
Главная идея Коли, о которой он говорит в интервью MIT News, в том, что модели должны не только генерировать кандидатов, но и «думать» как химики. В фарме важна не абстрактная новизна, а реальная применимость: молекула должна связываться с нужным белком, быть стабильной и при этом иметь путь синтеза в лаборатории.
По сути, команда внедряет в ML-модели химическую интуицию. Это помогает перейти от теоретических предсказаний к практической разработке препаратов.
Путь Коннора Коли: от химинжиниринга к ИИ-моделям
Коли учился на химического инженера в Caltech, а затем пришел в MIT на PhD. Во время аспирантуры он совмещал cheminformatics (вычислительный анализ химических данных), машинное обучение и автоматизацию реакций. В том числе он участвовал в проекте Make-It, финансируемом DARPA, где исследовали, как ускорить синтез лекарств с помощью данных и алгоритмов.
Позже, уже после постдока в Broad Institute, он собрал собственную лабораторию в MIT. Фокус остался прежним: не только находить известные терапевтические молекулы, но и проектировать новые, сразу учитывая их будущий синтез.
Что делает лаборатория сейчас
- Оценивает взаимодействие молекул с белками-мишенями.
- Предсказывает продукты химических реакций.
- Разрабатывает методы автоматизации экспериментов.
- Улучшает дизайн экспериментов, чтобы быстрее получать надежные результаты.
ShEPhERD и FlowER: модели, которые учитывают физику и механику реакций
Одна из разработок группы, ShEPhERD, анализирует, как потенциальные лекарственные молекулы взаимодействуют с белками на основе их 3D-формы. Такой подход уже используют фармкомпании для отбора кандидатов.
Вторая заметная система, FlowER, относится к классу генеративного ИИ для химии и прогнозирует, какие продукты получатся из заданных реагентов. В модель специально встроили фундаментальные ограничения, например закон сохранения массы, а также проверку реалистичности промежуточных стадий реакции.
Это важный сдвиг: модель не просто угадывает финальный результат, а учитывает путь, по которому реакция должна пройти. По данным команды, такие ограничения повышают точность предсказаний.
Почему это важно для индустрии ИИ и фармы
История Коли показывает общий тренд: следующий этап развития ИИ в науке, вероятно, связан не с универсальными моделями, а с domain-aware AI , то есть системами, глубоко встроенными в предметную область. Для фарминдустрии это означает меньше «пустых» экспериментов, более короткий цикл R&D и потенциально более быстрый выход новых лекарств.
Для рынка ИИ это тоже сигнал. Самые ценные модели в ближайшие годы, скорее всего, будут теми, что объединяют генеративные подходы с физическими законами, экспертными правилами и лабораторной проверяемостью. Химия и drug discovery становятся одним из ключевых полигонов для такого класса технологий.
Источник: news.mit.edu
