SynCoGen: синтезируемая 3D‑молекулярная генерация объединена в одном фреймворке
Вы когда‑нибудь задумывались, как ускорить поиск новых лекарств, не теряя связи с реализацией синтеза? Учёные представили SynCoGen — инновационный подход, который одновременно моделирует химические реакционные графы и трёхмерные координаты атомов, чтобы генерировать молекулы, у которых уже есть «рецепт» для лабораторного синтеза.
В основе SynCoGen — два продвинутых алгоритма: маскированная графовая диффузия, отслеживающая реакционные блоки, и flow‑matching, заботящийся о точных координатах атомов. Вместе они обучаются на уникальном датасете SynSpace, содержащем более 600 000 графов синтез‑дружественных блоков и свыше 3,3 млн их низкоэнергетичных конформеров. Такой «двойной» подход позволяет не просто рисовать молекулярные схемы, а сразу предлагать реальные пути их создания.
Почему это важно? До недавнего времени большинство моделей работали только с двумерными графами, упуская из виду трёхмерную геометрию, критичную для взаимодействия с белками и другими биомишенями. SynCoGen ломает это ограничение: он учится сразу двум вещам — как собрать молекулу из блоков и как расположить атомы в пространстве. Результат? Генерация молекул нового типа, готовых к синтезу и дальнейшему тестированию в три раза быстрее, чем раньше.
В тестах SynCoGen добился лучших показателей на общепринятых бенчмарках по генерации 3D‑структур и графов малого молекулярного веса. Ещё круче: каждая сгенерированная структура снабжается планом реакций, так что учёные сразу видят, как её воплотить «в стеклянной колбе» .
Взгляд вперёд
Что дальше? Исследователи планируют расширять выборку реакций и начать условную генерацию: например, создавать молекулы, идеально подогнанные под заданный рецептор белка или материал с конкретными свойствами. По сути, это первая ступень к полностью автоматизированной лаборатории на базе ИИ, где дизайн и синтез идут рука об руку.
