Биология

Представлена первая версия общего для всего человечества пангенома

Последовательность ДНК человека определена практически целиком. Но она более чем наполовину состоит из ДНК одного определенного человека и не отражает всего генетического разнообразия людей. Такая база начала наполняться лишь недавно. Пангеном включает данные для жителей всех населенных континентов, представителей разных народов и этнических групп.

Цвет глаз и рост, склонность к развитию сердечно-сосудистых заболеваний и диабета, оптимальные методы лечения рака — все это определяется наследственностью и активно исследуется. Однако в таких работах ученые обычно опираются на референсный геном, который составлен из ДНК небольшого числа людей и не отражает реального генетического разнообразия. Лишь недавно был сделан первый важный шаг к созданию подобной базы. Международный консорциум представил первую версию пангенома, включающего разные варианты генов, встречающиеся у людей из разных регионов мира. Статья об этом опубликована в журнале Nature.

Напомним, секвенирование генома человека в целом завершили еще в 2001 году, оно потребовало нескольких лет работы сотен ученых из десятков научных институтов. В нем не хватало примерно восьми процентов — участков, работа с которыми оказалась слишком сложна для технологий того времени. С тех пор референсный геном GRCh38 понемногу пополняется недостающими фрагментами, последний из которых добавили в 2022 году.

Эта практически полная версия называется T2T-CHM13. Она охватывает почти 100 процентов человеческой ДНК, но не отражает настоящей генетики человека. Ведь один и тот же ген у разных людей встречается в различных состояниях (аллелях), и даже некоторые участки, которые не кодируют белки, а выполняют структурную функцию в организации хромосом, могут различаться.

Более того, GRCh38 и T2T-CHM13 собрали из фрагментов, полученных всего у 20 человек, причем более 70 процентов референсных геномов принадлежат лишь одному из них. Да и остальные представляют потомков жителей Европы и Африки и не несут информации о генетических особенностях представителей других групп.

Все это стимулировало запуск очередного масштабного международного проекта: в рамках него консорциум Human Pangenome Reference Consortium (HPRC) ведет работу над пангеномом — базой, которая отражала бы все разнообразие геномов человечества. Для этого запустили отдельный проект 1000 Genomes, цель которого — сбор образцов ДНК, оптимально отражающих это разнообразие. И лишь недавно ученые представили первые результаты своей работы. Они включают данные полного секвенирования ДНК для 47 добровольцев со всех континентов, не считая Антарктиды.

Помимо этого, ученые собирали генетический материал у их родителей, определив, от кого именно был позаимствован тот или иной участок ДНК. Работа позволила дополнить GRCh38 новыми 119 миллионами пар оснований, которые прежде секвенировать не удавалось, — вдобавок к 3,2 миллиарда, определенным ранее. Ученые HPRC также определили более 1100 дупликаций — удвоений участков ДНК, играющих огромную роль в эволюции. Но главное в том, что пангеном позволяет рассмотреть вариативность генома человека, чтобы лучше понять, как эти различия влияют на организм и состояние здоровья.

Консорциум HPRC лишь начал работу и планирует дополнять пангеном человечества результатами секвенирования ДНК все новых и новых людей. Уже сейчас к нему добавляют данные еще 123 человек, а в следующем году ученые надеются довести общее число участников до 350. Особое внимание уделят жителям регионов, плохо охваченных подобными исследованиями, включая Юго-Восточную Азию и Ближний Восток.

Комментарии

  • в этом наборе тоже присутствует гены от людей с синдромом Дауна?

  • Чтобы найти надёжные связи между генотипом и фенотипом, к каждому секвенированному геному, как я понимаю, должно прилагаться максимально подробное описание его носителя во всех основных аспектах, причем желательно на протяжении всей жизни. Иначе ИИ не сможет разобраться, что от чего зависит. Про человеческий разум тут и говорить не стоит - ему такая задача точно не по силам.