Что такое инфохимия?

Инфохимия — это новая междисциплинарная область на стыке химии и ИТ, которая использует большие данные, моделирование и искусственный интеллект для работы с молекулами, материалами и лекарствами.

Инфохимия возникла на пересечении химии, биологии, компьютерных технологий и математики: она изучает, как на молекулярном уровне «записывается» и обрабатывается информация и как можно программировать молекулы под нужные свойства.

Она сочетает следующие направления:

  • хемоинформатику (работа с химическими базами данных и предсказательными моделями),

  • хемометрику (статистика и анализ химических экспериментов),

  • компьютерное моделирование,

  • большие данные и машинное обучение,

  • роботизированные лаборатории.

Это позволяет проектировать новые лекарства, материалы, тест-системы, «умную» упаковку и электронику, цифровые двойники химических производств и лабораторных процессов. Одним из наиболее востребованных направлений инфохимии является дизайн лекарств.

В чем сложность дизайна лекарств

Создание нового лекарственного вещества — это длинный и дорогой путь: из сотен тысяч кандидатов до аптечной полки доходят единицы, а процесс занимает 10–15 лет и требует огромных вложений. К молекуле лекарства предъявляются противоречивые требования: она должна быть достаточно активной против мишени (например, белка), безопасной для человека, стабильной, удобной в производстве и хранении, подходить под форму выпуска (таблетка, инъекция и т.п.).

При этом «химическое пространство» — число возможных молекул — астрономически велико, поэтому просто перебрать «на глаз» и вручную синтезировать все варианты физически невозможно. Даже в крупных лабораториях удается экспериментально протестировать максимум тысячи соединений, тогда как потенциальных кандидатов могут быть миллиарды.

Как помогает машинное обучение

Машинное обучение в инфохимии позволяет исследовать химические структуры виртуально, на компьютере: модели обучают на данных о уже известных молекулах, их активности и свойствах и затем используют для быстрого отбора перспективных кандидатов.

Такие алгоритмы могут оценивать афинность (способность к связыванию) молекулы-кандидата к белку-мишени, прогнозировать токсичность, растворимость, стабильность, подбирать оптимальные формулы и даже предлагать новые структуры, которые человек сам вряд ли бы придумал.

Виртуальный скрининг дает возможность просматривать не тысячи, а миллиарды потенциальных соединений, резко сужая круг тех, которые нужно реально синтезировать и тестировать в лаборатории.

Исследования показывают, что, оценив экспериментально небольшое число молекул и обучив на них модель, можно затем точно предсказывать перспективные вещества из огромного списка, заметно ускоряя разработку лекарств и уменьшая количество дорогостоящих опытов. В одном из проектов по лекарствам пролонгированного действия ученые с помощью машинного обучения смогли подобрать рабочую рецептуру практически с первой попытки, вместо долгого перебора вариантов.

Небольшой пример: вместо того чтобы синтезировать тысячу похожих молекул и проверять каждую, исследователь строит модель, которая по структуре заранее оценивает, какие 20–30 вариантов действительно стоят эксперимента — остальные отсекаются на этапе компьютерного расчета.

Какие возможности для обучения инфохимии дает наша школа?

  1. Изучение молекулярной биологии и биоинформатики дает понимание о структуре и взаимодействии биомолекул, а углубленный курс химии и периодические лекции по инфохимии от преподавателей ИТМО и Химцентра 239 – как мире биомолекул действуют синтетические вещества.

  2. Школьники вовлечены в исследовательские проекты, некоторые из которых имеют непосредственное или косвенное отношение к инфохимии.

  3. Некоторые ребята вовлечены в олимпиадную деятельность по профилю НТО «Инфохимия» и посещают тематические школы ИТМО.

 

Какие вузы в Петербурге и Москве готовят специалистов в области инфохимии

В Санкт-Петербурге ключевым центром инфохимии является Университет ИТМО: это первая и пока единственная в России полноценная образовательная программа «Инфохимия» на уровне бакалавриата и магистратуры.

Студенты изучают фундаментальную и прикладную химию, биотехнологию, программирование, машинное обучение, работу с большими данными, робототехнику и с первого курса вовлечены в реальные научные и индустриальные проекты.

Рядом стоящие по тематике программы — «цифровые технологии в химии», компьютерное моделирование химических процессов, обработка больших данных в химии — появляются и в других вузах, например, в Санкт-Петербургском государственном университете (программа магистратуры по цифровым технологиям в химии для внедрения ИТ в исследования и производство).

В Москве близкие компетенции дают программы по хемоинформатике, моделированию в химии, вычислительной химии и биоинформатике в ведущих университетах, но именно под названием «инфохимия» флагманом сейчас остается ИТМО как общероссийский центр.

Перспективы карьеры

Выпускники-инфохимики могут работать:

  • в фармацевтических компаниях и биотех-стартапах, занимаясь компьютерным дизайном лекарств, анализом данных доклинических и клинических испытаний, цифровыми лабораториями

  • в химической и пищевой промышленности, создавая новые материалы, покрытия, упаковку, функциональные продукты, оптимизируя технологии с помощью моделирования и цифровых двойников

  • в ИТ-компаниях и R&D-центрах как разработчики и аналитики, специализирующиеся на данных о химических и биологических системах, в том числе в проектах искусственного интеллекта

  • в научно-исследовательских институтах и университетах, продолжая академическую карьеру и развивая саму область инфохимии

Выпускники работают инженерами-исследователями, специалистами по машинному обучению в фарме и химии, дата-аналитиками, технологами цифровых производств. Их зарплаты в крупных городах и международных компаниях обычно сопоставимы с уровнем хороших ИТ-специалистов аналогичной квалификации. С учетом цифровизации фармацевтики и химической промышленности спрос на такие кадры прогнозируется устойчивым: растет число проектов по автоматизации лабораторий, внедрению ИИ в разработку лекарств и материалов.