Молодые ученые из России выиграла престижный конкурс в Стэнфордском университете, опередив более 700 команд со всего мира. Участники создавали систему искусственного интеллекта, которая точнее предскажет трехмерную структуру молекул РНК, пишет «Rg.ru».
Создание подобной системы — одна из самых сложных задач в биологии. Для медицины решение этой задачи открывает огромные перспективы. Знание структуры РНК сделает возможным создание фармацевтических препаратов и вакцин, более эффективных, чем существующие сейчас.
В составе российской команды-победительницы были Дмитрий Пензар, аспирант Института общей генетики РАН, преподаватель факультета биоинженерии и биоинформатики МГУ, Арсений Зинкевич, научный сотрудник Института общей генетики РАН, Валерий Вяльцев, Артемий Бакулин и Елизавета Носкова, студенты факультета биоинженерии и биоинформатики МГУ.
Популярность использования нейросетей в геномике объясняется их способностью получать прорывные результаты без длительных и дорогостоящих экспериментов. Именно нейросети недавно помогли ученым получить трехмерную структуру белков человека. Поскольку у каждого человека в организме огромное количество белков, и их последовательности в силу мутаций отличаются от усредненного образца, экспериментально получить все варианты было просто невозможно. Ученые обучили нейросети, показывая последовательности аминокислот различных белков и их трехмерные структуры, полученные опытным путем. Усвоив эти примеры ИИ стал быстро строить структуру огромного количества белков. Это дало медикам невиданные ранее возможности по разработке новых фармацевтических препаратов и методов лечения.
Задачу, которую решали молодые исследователи на конкурсе, была подобной. «В принципе задача нейросети в данном случае аналогичная: по последовательности нуклеотидов предсказать трехмерную структуру РНК», — пояснил Дмитрий Пензар, лидер российской команды на конкурсе. Однако с РНК такое обучение провести сложно, поскольку большого числа экспериментальных данных, как это было в случае с белками, у ученых нет.
Для проведения конкурса ученые в Стэнфорде собрали не прямые, а косвенные данные о возможной структуре более миллиона различных РНК, своеобразные «наводки» на возможную структуру. «Жюри подготовило для участников два блока данных: миллион разных последовательностей нуклеотидов РНК, и для каждой полученные в эксперименте «наводки». Задача научить ИИ самому предсказывать «наводки» по последовательности РНК, не используя данные эксперимента. Наша модель сделала это лучше всех, опередив остальных участников. Это открывает возможность сделать следующий и решающий шаг — предсказывать трехмерную структуру молекул РНК», — пояснил Дмитрий Пензар суть задачи, которую решала российская команда
Член-корреспондент РАН Всеволод Макеев, оценивая победу российской команды отметил, что, в конкурсе участвовали сильнейшие команды из ведущих научных центров, университетов и крупных фирм. Победа российской команды особенно значима, так как они смогли объединить различные методы предсказаний, которые обычно мешают друг другу. Это достижение стало возможным благодаря знаниям, интуиции и профессионализму молодых ученых. Материал о разработке российской команды появится в авторитетном научном журнале Nature. Вычислительные биологи из Института общей генетики РАН уже побеждали в международных конкурсах «предсказателей», организованных научным международным консорциумом DREAM в 2016 году и 2022 годах.
В октябре 2023 года молодежное научное общество СПХФУ победило в конкурсе на II Всероссийском форуме «Наукабиомед» с проектом по применению нейросети для прогноза влияния новых лекарств на клетки мозга.
Фото: из личных архивов участников (на ««Rg.ru»).