Предложен новый метод IBDmix для поиска последовательностей, заимствованных из генома древних видов, в геноме современного человека. Авторы применили его к двум с половиной тысячам геномов из базы данных «1000 Genomes Project». Этим методом удалось найти неандертальские включения не только в геномах неафриканского происхождения, но и в африканских геномах (около 0,3%). Это объясняется двумя причинами: обратной миграцией из Евразии в Африку и потоком генов от неандертальцев к сапиенсам еще до выхода из Африки. Оказалось также, что неандертальский след в геномах современных популяций распределен более равномерно, чем считалось ранее. Новый метод показал, что в восточноазиатских популяциях неандертальских включений всего лишь на 8% больше, чем в европейских (а не на 20%, как было показано ранее).
Происходившая в истории Homo sapiens метисация с неандертальцами уже многократно доказана, и в геномах современных людей от этого эпизода содержится около 2% последовательностей ДНК, заимствованных от неандертальцев. Но до сих пор считалось, что это касается людей неафриканского происхождения (причем в восточноазиатских популяциях содержится примерно на 20% больше неандертальских генов, чем в европейских). У африканцев не было шанса встретиться в своем прошлом с неандертальцами, соответственно, в их геномах не может быть неандертальского следа. Это утверждение, тем не менее, оказалось опровергнуто в последнем исследовании, результаты которого опубликованы в журнале Cell. Применив новый подход, генетики под руководством специалистов из Принстонского университета показали, что и в геномах африканского происхождения имеются неандертальские фрагменты.
В ранее существующих методах, которые применялись для поиска включений из древнего генома в современный, использовали для сравнения «беспримесный» африканский геном (обычно из популяции йоруба). Новый метод IBDmix, разработанный авторами статьи, не требует наличия современного референсного генома. Алгоритм IBDmix основан на вычислении вероятности, что некий участок в современном геноме не имеет общего происхождения с участком генома древнего вида. Это метод является развитием метода IBD (identical by descent), используемого в популяционной генетике для выявления родства между парами современных геномов, в котором идет поиск в них сегментов общего происхождения.
IBDmix использует биоинформатический подход к анализу последовательностей, которые в геноме современного человека выглядят похожими на неандертальские последовательности. Этот подход позволяет различить, является ли это сходство следствием происхождения от общего предка сапиенсов и неандертальцев (который жил примерно 500 тыс. лет назад), или же это результат значительно менее древнего события метисирования сапиенсов и неандертальцев (около 50 тыс. лет назад). Как и при сравнении пар геномов из разных современных популяций, оценка времени делается на основании длины сходных последовательностей: чем длиннее последовательность, чем меньше времени прошло с момента ее появления. Авторы подчеркивают, что по сравнению с ранее существующими методами у IBDmix ниже частота ложноположительных результатов и выше мощность при выявлении сегментов >30 kb (килобаз, тысяч пар оснований).
Исследователи применили метод IBDmix к геномам из базы данных проекта “1000 Genomes Project”, используя геном алтайского неандертальца для поиска неандертальских интрогрессий. В геномах 2504 современных индивидов они выявили в общей сложности 110,98 Gb (гигабаз) неандертальских последовательностей, а когда исключили перекрывание, в итоге получили 1,29 Gb уникальных неандертальских последовательностей.
Самое интересное, что новым методом впервые удалось выявить неандертальские последовательности в африканских геномах, они составили в среднем 17 Mb (мегабаз) на геном, примерно 0,3% генома. Причем более 94% неандертальских последовательностей, обнаруженных в африканских геномах, присутствует также и в геномах неафриканских популяций.

Величина неандертальских включений на геном (в Mb) в разных популяциях из базы «1000 Genomes Project»: EAS – Восточная Азия, SAS – Южная Азия, EUR — Европа, AMR — Америка, ACB/ASW – смешанная популяция, AFR – Африка. График справа отображает эту величину в разных африканских популяциях.
В работе также перепроверено содержание неандертальских интрогрессий в геномах неафриканских популяций. Так, в геномах европейского происхождение найдено 51 Mb неандертальских последовательностей на геном, в восточноазиатских и южноазиатских геномах — 55 Mb на геном. То есть новый метод показал преобладание неандертальского генетического следа в азиатских популяциях по сравнению с европейскими всего лишь на 8% (по предшествующим оценкам разница составляет 20%).
Для того, чтобы понять происхождение неандертальских включений в африканский геном, авторы оценили в нем также включения денисовского происхождения, получили 1,2 Mb на геном. Это сравнимо с содержанием денисовских фрагментов в неафриканских геномах и значительно меньше, чем содержание неандертальских фрагментов в африканских геномах.
Исходя из этого, ученые предложили две демографические модели, объясняющие неандертальский след в африканских геномах. Одна модель объясняет его обратной миграцией из Евразии в Африку людей, в чьих геномах уже содержались неандертальские включения. Вторая – ранней метисацией с неандертальцами, которая произошло еще до выхода современного человека из Африки.

Демографические модели включения неандертальских аллелей в геном современного человека. Слева – показан только поток генов от неандертальцев к сапиенсам после выхода из Африки; в центре – показана обратная миграция из Европы в Африку; справа – показан поток генов от современного человека к неандертальцам до выхода из Африки.
Эти модели были проверены по отдельности и суммарно, после чего сделан вывод, что имели место оба сценария: как ранний (до выхода из Африки) поток генов от современного человека к неандертальцам, так и обратная миграция из Евразии в Африку. Оба стали причиной неандертальского следа в африканском геноме, хотя роль обратной миграции представляется значительнее. Это подтверждается бóльшим перекрытием неандертальских последовательностей в африканском геноме с таковыми в геноме европейцев, чем с таковыми в азиатском геноме.
Авторы использовали новый метод и для оценки адаптивного значения неандертальских аллелей в геноме современного человека. Они проанализировали 38 неандертальских гаплотипов, встречающихся с высокой частотой в неафриканских геномах (ранее было известно 19), а также 31 гаплотип, достигающий высокой частоты как в неафриканских, так и в африканских популяциях, и 13 специфических для африканцев неандертальских гаплотипов. Среди последних были гены, вовлеченные в систему иммунитета (IL22RA1 и IFNLR1) и в защиту от ультрафиолетовой радиации (DDB1 и IL22RA1).
В статье отмечается, что метод IBDmix имеет несколько ограничений. Прежде всего, он требует наличия секвенированного древнего генома, поэтому не подходит для поиска интрогрессий от неизвестного вида гоминин и от вида с неизученным геномом. Метод работает с выборками большого размера, поэтому его трудно применить к индивидуальным геномам или к древним геномам современного человека, где объем выборки ограничен.
текст Надежды Маркиной
Источник:
Lu Chen et al. Identifying and Interpreting Apparent Neanderthal Ancestry in African Individuals // 2020, Cell 180, 1–11
February 20, 2020 ª 2020 Published by Elsevier Inc. https://doi.org/10.1016/j.cell.2020.01.012
Хорошо бы уточнить даты переноса генов в разных сценариях, включая вклад денисовцев.