Геном человека можно сравнить с огромной библиотекой. Раньше ученые умели читать только небольшую часть книг — те, в которых записаны инструкции по созданию белков (это около 2% всей ДНК). Именно там обычно искали мутации, ответственные за наследственные болезни сердца. Для таких вариантов существуют отработанные международные критерии, позволяющие оценить их опасность и выявить мутации, ведущие к развитию заболеваний. Но что делать с остальными 98%? Долгое время считалось, что это просто «пустые страницы» или «генетический мусор». Однако оказалось, что эти участки вовсе не бесполезны: они действуют как выключатели и регуляторы громкости, управляя тем, как активно работают гены. Если в таких участках происходит поломка, это может серьезно повлиять на работу сердца, сосудов и крови.
Проблема заключалась в том, что раньше ученые не могли точно определить, какие из этих «невидимых» мутаций действительно опасны, а какие безвредны. Поэтому многие случаи сердечных заболеваний оставались необъяснимыми именно из-за невозможности проанализировать некодирующие варианты (то есть те, которые не несут прямых инструкций по сборке белков). Ученые Института ИИиЦН ФКН НИУ ВШЭ представили программное решение, которое впервые позволяет массово и точно анализировать эти «молчащие» участки применительно к здоровью сердца. Программа использует самые современные технологии — генеративные модели (те же, что лежат в основе популярных нейросетей), чтобы предсказывать последствия мутаций в регуляторных участках ДНК и оценивать их влияние на здоровье сердца.
«В основе программы лежат две мощные ИИ-модели, которые можно сравнить с экспертами, прочитавшими миллионы генетических инструкций. Они умеют сравнивать два варианта ДНК: здоровый (эталонный) и тот, где произошла мутация. Затем программа оценивает, изменилась ли после этой мутации “громкость” работы генов, то есть стали они активнее или, наоборот, притихли. Мы сконцентрировались на анализе тканей сердца и сосудов, но можно анализировать любые ткани», — рассказала Мария Попцова, директор Центра биомедицинских исследований и технологий Института ИИиЦН ФКН НИУ ВШЭ.
Для повышения точности программа использует коллективный разум: сразу несколько моделей изучают мутацию с разных сторон, а затем объединяют свои выводы с помощью методов искусственного интеллекта. В результате программа выдает простую и понятную оценку — число от 0 до 1. Чем ближе цифра к единице, тем выше вероятность, что обнаруженная мутация опасна и может повлиять на развитие болезней сердца.
Чтобы убедиться, что программе можно доверять, ученые провели строгую проверку. Для этого использовались данные британского проекта UK Biobank — огромной базы генетической информации. Для теста отобрали более 11 тысяч мутаций из тех самых «регуляторных» участков ДНК, которые раньше было сложно анализировать. Среди них были как варианты, уже точно связанные с заболеваниями, так и заведомо безвредные. Чтобы эксперимент был честным, каждую подозрительную мутацию сравнивали с девятью безопасными, подобранными по максимальному количеству совпадений: месту в геноме, типу участка, соседству с генами и другим параметрам. Программа успешно справилась с задачей: она безошибочно отличила опасные мутации от безвредных, доказав свою надежность и готовность к практическому использованию.
Программа создана для практического использования разными специалистами, сотрудники медицинских лабораторий и кардиологических центров, которые смогут точнее интерпретировать результаты полногеномного секвенирования и искать генетические причины заболеваний у пациентов (она уже внедряется в работу генетических лабораторий). Как отмечают разработчики, для работы с программой не нужно быть программистом: она создана так, чтобы ею могли пользоваться генетики, биоинформатики и медицинские исследователи в своей повседневной практике.
В фундаментальных исследованиях программа может помочь понять молекулярные механизмы развития болезней сердца и изучать, как регуляторные участки ДНК влияют на патологии. В Центре биомедицинских исследований и технологий НИУ ВШЭ благодаря программе ученые уже сделали важное открытие: оказалось, что определенные варианты гена BMPR2, влияющие на его активность, предопределяют то, как пациент будет реагировать на лечение. Сейчас исследователи продолжают работу: они ищут некодирующие участки ДНК, влияющие на работу генов, связанных с риском внезапной сердечной смерти.
