Мир малых молекул настолько огромен, что классический «перебор вариантов» в фарме давно перестал работать. По оценкам, потенциально полезных соединений может быть от 1020 до 1060. Даже если автоматизировать лабораторию, проверить все экспериментально невозможно. Именно поэтому сегодня на первый план выходит связка химии и искусственного интеллекта, где модели не просто предсказывают, а учатся мыслить ближе к тому, как рассуждает химик.

Почему «просто нейросеть» для химии не работает
В обычных задачах ИИ можно опереться на статистику: модель находит паттерны в данных и выдает правдоподобный ответ. Но химия требует большего. Здесь ответ должен быть не только «похожим», но и физически возможным.
Если провести аналогию: генерация текста позволяет «сочинить» красивое предложение, даже если факт в нем неверен. В синтетической химии такая ошибка стоит месяцев работы и миллионов долларов. Поэтому в современных химических моделях внедряют ограничения: закон сохранения массы, правдоподобность промежуточных стадий, совместимость реагентов, стереохимию и др.
Кейс MIT: как Коннор Коли строит «химически осмысленный» ИИ
Профессор MIT Коннор Коли работает на стыке chemical engineering, EECS и вычислительной химии. Его подход можно описать так: не подгонять химию под ИИ, а подгонять ИИ под реальную логику химии.
Еще во время PhD в MIT (в том числе в рамках DARPA-программы Make-It) Коли занимался планированием реакционных путей и автоматизацией синтеза. После постдока в Broad Institute, где он работал с миллиардными библиотеками молекул, он сформировал в MIT лабораторию с миссией: не только искать известные терапевтические молекулы, но и проектировать новые молекулы и новые маршруты их синтеза.
ShEPhERD: генерация и отбор молекул с учетом 3D-взаимодействий
Одна из моделей группы, ShEPhERD, оценивает перспективные молекулы по тому, как их трехмерная форма взаимодействует с белком-мишенью. Для drug discovery это критично: молекула может быть «правильной» по формуле, но провалиться по пространственной посадке в активном центре белка.
Именно такой 3D-фокус приближает ИИ к медицинской химической интуиции: модель учитывает не только абстрактные дескрипторы, но и геометрию связывания. По данным MIT, этот подход уже используется фармкомпаниями.

FlowER: предсказание реакций с учетом механизма
Второй важный проект, FlowER, прогнозирует продукты реакций при заданных входных компонентах. Ключевая инновация в том, что модель не ограничивается «угадыванием финального продукта», а учитывает:
- фундаментальные физические ограничения (например, сохранение массы),
- правдоподобность промежуточных стадий,
- механистическую эволюцию реакции от реагентов к продуктам.
Проще говоря, модель решает задачу как опытный химик на доске: не только «что получится», но и «почему именно так и через какие шаги». По наблюдениям исследователей, это повышает точность предсказаний.
Что это меняет для индустрии прямо сейчас
Главный сдвиг в том, что ИИ в химии переходит от роли «поисковика в данных» к роли партнера по научной гипотезе. Это влияет на всю цепочку R&D.
| Этап в фарме | Классический подход | Подход с химически информированным ИИ |
|---|---|---|
| Hit discovery | Массовый скрининг и долгий отсев | Приоритизация кандидатов по 3D-связыванию и свойствам |
| Route scouting | Ручной подбор синтетических маршрутов | Предсказание реакций и проверка реализуемости шагов |
| Lead optimization | Итерации с высокой долей проб и ошибок | Генерация структур с учетом «химической интуиции» модели |
| Стоимость ошибки | Высокая, особенно на поздних стадиях | Раннее отсечение нежизнеспособных вариантов |
Экономический эффект очевиден: меньше тупиковых экспериментов, быстрее цикл «гипотеза → проверка», лучше фокус лабораторных ресурсов.
Почему это важно не только для лекарств
Хотя основной фокус Коли, по его словам, это малые молекулы для медицины, сам подход универсален для органической химии: материалы, полимеры, агрохимия, каталитические системы. Везде, где есть огромные пространства молекулярных вариантов, ИИ с физическими ограничениями дает кратный выигрыш.

Ограничения и риски: где нельзя переоценивать ИИ
1. Качество данных все еще решает
Если обучающие реакционные базы неполные или смещенные, даже умная архитектура будет воспроизводить эти пробелы.
2. Лабораторная валидация обязательна
ИИ ускоряет выбор гипотез, но не заменяет эксперимент. В химии истина проверяется колбой, а не только метрикой на валидационном датасете.
3. Интерпретируемость важнее, чем в ряде других ИИ-задач
Для промышленного внедрения нужно объяснять, почему модель предлагает конкретный маршрут, иначе доверие технологов и химиков будет ограничено.
Что дальше: вероятный вектор на 3–5 лет
- Гибридные модели: больше сочетаний ML + физика + квантово-химические приближения.
- Closed-loop платформы: ИИ предлагает эксперимент, роботизированная станция выполняет, данные возвращаются в модель.
- Мультимодальность: объединение текстовых протоколов, спектров, структур и кинетики в одном контуре принятия решений.
- Сдвиг роли химика: меньше рутины перебора, больше проектирования стратегии и проверки научных гипотез.
Итог простой: будущее не за «магическим ИИ», который заменит химиков, а за системами, которые встроены в научную методологию и понимают фундаментальные ограничения природы. Подход MIT и команды Коннора Коли, включая ShEPhERD и FlowER, как раз демонстрирует эту зрелую траекторию развития.
Для отрасли это сигнал: конкурентное преимущество получат не те, кто первым внедрил генеративные модели, а те, кто научил их мыслить в терминах реальной химии.