Что такое инфохимия?
Инфохимия — это новая междисциплинарная область на стыке химии и ИТ, которая использует большие данные, моделирование и искусственный интеллект для работы с молекулами, материалами и лекарствами.
Инфохимия возникла на пересечении химии, биологии, компьютерных технологий и математики: она изучает, как на молекулярном уровне «записывается» и обрабатывается информация и как можно программировать молекулы под нужные свойства.
Она сочетает следующие направления:
хемоинформатику (работа с химическими базами данных и предсказательными моделями),
хемометрику (статистика и анализ химических экспериментов),
компьютерное моделирование,
большие данные и машинное обучение,
роботизированные лаборатории.
Это позволяет проектировать новые лекарства, материалы, тест-системы, «умную» упаковку и электронику, цифровые двойники химических производств и лабораторных процессов. Одним из наиболее востребованных направлений инфохимии является дизайн лекарств.

В чем сложность дизайна лекарств
Создание нового лекарственного вещества — это длинный и дорогой путь: из сотен тысяч кандидатов до аптечной полки доходят единицы, а процесс занимает 10–15 лет и требует огромных вложений. К молекуле лекарства предъявляются противоречивые требования: она должна быть достаточно активной против мишени (например, белка), безопасной для человека, стабильной, удобной в производстве и хранении, подходить под форму выпуска (таблетка, инъекция и т.п.).
При этом «химическое пространство» — число возможных молекул — астрономически велико, поэтому просто перебрать «на глаз» и вручную синтезировать все варианты физически невозможно. Даже в крупных лабораториях удается экспериментально протестировать максимум тысячи соединений, тогда как потенциальных кандидатов могут быть миллиарды.
Как помогает машинное обучение
Машинное обучение в инфохимии позволяет исследовать химические структуры виртуально, на компьютере: модели обучают на данных о уже известных молекулах, их активности и свойствах и затем используют для быстрого отбора перспективных кандидатов.
Такие алгоритмы могут оценивать афинность (способность к связыванию) молекулы-кандидата к белку-мишени, прогнозировать токсичность, растворимость, стабильность, подбирать оптимальные формулы и даже предлагать новые структуры, которые человек сам вряд ли бы придумал.
Виртуальный скрининг дает возможность просматривать не тысячи, а миллиарды потенциальных соединений, резко сужая круг тех, которые нужно реально синтезировать и тестировать в лаборатории.
Исследования показывают, что, оценив экспериментально небольшое число молекул и обучив на них модель, можно затем точно предсказывать перспективные вещества из огромного списка, заметно ускоряя разработку лекарств и уменьшая количество дорогостоящих опытов. В одном из проектов по лекарствам пролонгированного действия ученые с помощью машинного обучения смогли подобрать рабочую рецептуру практически с первой попытки, вместо долгого перебора вариантов.
Небольшой пример: вместо того чтобы синтезировать тысячу похожих молекул и проверять каждую, исследователь строит модель, которая по структуре заранее оценивает, какие 20–30 вариантов действительно стоят эксперимента — остальные отсекаются на этапе компьютерного расчета.
Какие возможности для обучения инфохимии дает наша школа?
Изучение молекулярной биологии и биоинформатики дает понимание о структуре и взаимодействии биомолекул, а углубленный курс химии и периодические лекции по инфохимии от преподавателей ИТМО и Химцентра 239 – как мире биомолекул действуют синтетические вещества.
Школьники вовлечены в исследовательские проекты, некоторые из которых имеют непосредственное или косвенное отношение к инфохимии.
Некоторые ребята вовлечены в олимпиадную деятельность по профилю НТО «Инфохимия» и посещают тематические школы ИТМО.
Какие вузы в Петербурге и Москве готовят специалистов в области инфохимии
В Санкт-Петербурге ключевым центром инфохимии является Университет ИТМО: это первая и пока единственная в России полноценная образовательная программа «Инфохимия» на уровне бакалавриата и магистратуры.
Студенты изучают фундаментальную и прикладную химию, биотехнологию, программирование, машинное обучение, работу с большими данными, робототехнику и с первого курса вовлечены в реальные научные и индустриальные проекты.
Рядом стоящие по тематике программы — «цифровые технологии в химии», компьютерное моделирование химических процессов, обработка больших данных в химии — появляются и в других вузах, например, в Санкт-Петербургском государственном университете (программа магистратуры по цифровым технологиям в химии для внедрения ИТ в исследования и производство).
В Москве близкие компетенции дают программы по хемоинформатике, моделированию в химии, вычислительной химии и биоинформатике в ведущих университетах, но именно под названием «инфохимия» флагманом сейчас остается ИТМО как общероссийский центр.
Перспективы карьеры
Выпускники-инфохимики могут работать:
в фармацевтических компаниях и биотех-стартапах, занимаясь компьютерным дизайном лекарств, анализом данных доклинических и клинических испытаний, цифровыми лабораториями
в химической и пищевой промышленности, создавая новые материалы, покрытия, упаковку, функциональные продукты, оптимизируя технологии с помощью моделирования и цифровых двойников
в ИТ-компаниях и R&D-центрах как разработчики и аналитики, специализирующиеся на данных о химических и биологических системах, в том числе в проектах искусственного интеллекта
в научно-исследовательских институтах и университетах, продолжая академическую карьеру и развивая саму область инфохимии
Выпускники работают инженерами-исследователями, специалистами по машинному обучению в фарме и химии, дата-аналитиками, технологами цифровых производств. Их зарплаты в крупных городах и международных компаниях обычно сопоставимы с уровнем хороших ИТ-специалистов аналогичной квалификации. С учетом цифровизации фармацевтики и химической промышленности спрос на такие кадры прогнозируется устойчивым: растет число проектов по автоматизации лабораторий, внедрению ИИ в разработку лекарств и материалов.
