Книга: Кому мешает ДНК-генеалогия?

Глава 2 Основные понятия и главные положения ДНК-генеалогии

<<< Назад
Вперед >>>

Глава 2

Основные понятия и главные положения ДНК-генеалогии

Вопрос 16: Как в Y-хромосоме образуются мутации?

Время от времени при копировании Y-хромосомы в копии проскакивают ошибки. Фермент под названием ДНК-полимераза (на самом деле вместе с целым набором молекулярных инструментов копировальной машины) или просто ошибается и делает некоторые участки ДНК короче или длиннее, удлиняя или сокращая «тандемные повторы» нуклеотидов, или «ремонтирует» повреждённые участки и в ходе «ремонта» удаляет повреждение (эта операция называется «делеция»), или «вшивает» новый нуклеотид (называется «вставка», или «инсерт»). То, что удалось отремонтировать, в мутации не попадает, как будто мутации и не было. Что не удалось – передается сыну при рождении. Если родилась дочь, то Y-хромосома не передается. Если есть только дочери, или детей нет – Y-хромосома терминируется, вместе с мужской наследственной линией.

Мутации, которые интересуют ДНК-генеалогию, бывают двух типов – или изменение числа повторов, тандемов (STR), что описано выше, или «точечные», одно– или несколько-нуклеотидные (SNP), снипы.

Оказалось, что многие повторы нуклеотидов находятся у разных людей в одних и тех же участках Y-хромосомы. Эти участки уже специалистами пронумерованы, классифицированы, сведены в списки. Они получили название «маркеры». Набор маркеров, точнее, повторов в них, называется «гаплотип». Уже известных маркеров – больше тысячи. Они, как правило, одни и те же у всех людей на Земле и отличаются друг от друга только числом повторов, что вызвано теми самыми ошибками ферментов (и других элементов биологического копирования) при копировании из поколения в поколение.

Примеры повторов приведены в ответе на вопрос 14. Ясно, что «мутации», которые приводят к изменению числа тандемных повторов в Y-хромосоме, не есть те «мутации», о которых все имеют представление как о «поломках в генах», например, под воздействием радиации. Мутации, которые рассматривают в гаплотипах, происходят не в генах и не являются «поломками». Это, как объяснено выше – ошибки при копировании ДНК. Они имеют весьма сложную архитектуру, и радиацией не вызываются. Это – не поломка, а координированная перестройка.

Вопрос 17: Что такое «общий предок» выборки носителей гаплотипов, и как мутации могут помочь определить, когда он жил?

Любая группа мужчин, относящихся к одной и той же гаплогруппе и к одному и то же субкладу, а также к любой выборке гаплотипов, образующей ветвь в пределах одного субклада, являются в каждом случае родственниками, и происходят от одного общего предка. Можно привести и обратное определение – если мутация, которая осуществилась в Y-хромосоме, унаследовалась в ДНК потомков, то все эти потомки происходят от одного общего предка, у которого и произошла данная мутация.

В принципе, в любой гаплогруппе и любом субкладе имеется множество групп людей, которые происходят от их общего предка. Например, у двух родных братьев есть общий предок – их отец. Если к ним добавить дядю, то общий предок всех троих – отец дяди и дедушка братьев.

Чем глубже во времени общий предок группы людей, или популяции, в терминах ДНК-генеалогии, тем больше у него потомков. Все потомки наследуют гаплотип их общего предка, но чем дальше во времени отстоит общий предок, тем больше мутаций накапливается в гаплотипах потомков. Приведем простой пример. Допустим, общий предок жил 2500 лет назад, то есть 100 условных поколений назад (в ДНК-генеалогии за условное поколение принимается 25 лет, и константы скоростей мутации вычисляются в расчете на условное поколение протяженностью 25 лет). Если выявить сто потомков этого общего предка, в их 12-маркерных гаплотипах обнаружится примерно 200 мутаций, причем у 14 человек гаплотипы будут одинаковыми, и все 200 мутаций будут неупорядоченно распределены, в разной степени, между оставшимися 86 потомками.

Вот эти одинаковые 14 гаплотипов и представляют собой предковый гаплотип. За прошедшие 100 поколений – чисто статистически – в гаплотипах 86 потомков пройдут мутации, а в гаплотипах 14 потомков мутаций еще не будет. Вот таким образом определяют предковый, или базовый гаплотип.

Проверим представленные выше числа. 200 мутаций в 100 гаплотипах в 12-маркерном формате (константа скорости мутаций в 12-маркерных гаплотипах равна 0.02 мутаций на гаплотип за условное поколение) соответствуют величине 200/100/0.02 = 100 условных поколений, то есть примерно 2500 лет (здесь для простоты не вводится поправка на возвратные мутации, смысл которой будет пояснен в следующей главе). Это – линейный метод расчета времени до общего предка популяции. В то же время согласно логарифмическому методу если из 100 гаплотипов в 12-маркерном формате остались неизменными 14, то это соответствует времени, прошедшему от общего предка популяции, равному [ln(100/14)]/0.02 = 98 условных поколений, то есть примерно тому же времени, рассчитанному с помощью линейного метода.

Из этого примера должно быть понятно, что чем более недавний общий предок, тем большее число идентичных друг другу гаплотипов (или их фрагментов) наблюдается в выборке, и тем надежнее выявляется предковый гаплотип. Если общий предок жил очень давно, то одинаковых гаплотипов в выборке может остаться всего два-три – например, три гаплотипа из сотни 12-маркерных гаплотипов останутся при [ln(100/з)]/0.02 = 175 условных поколений до общего предка, то есть общий предок жил 4375 лет назад (на самом деле больше при учете возвратных мутаций). Когда в серии гаплотипов наблюдаются всего два-три одинаковых гаплотипа, они могут не обязательно быть предковыми, а оказаться одинаковыми случайно, в результате игры неупорядоченных мутаций. Поэтому понятие «предковый» гаплотип лучше не употреблять, за исключением совсем уже явных случаев, и в ДНК-генеалогии вместо «предковый» гаплотип обычно употребляют «базовый».

Итак, общий предок популяции – это предполагаемый носитель «базового», или «предкового» гаплотипа. Время жизни общего предка популяции вычисляется по совокупности гаплотипов его потомков, принимая во внимание число мутаций, накопившееся в популяции, нормированное на гаплотип или на маркер, и константу скорости мутации, или частоту мутации в расчёте на поколение. Расчёты времён жизни общих предков популяций позволяют делать предположения о времени и направлениях миграций популяций в древности, о передвижениях популяций. Поскольку, передвигаясь, популяции оставляли следы в виде материальных признаков, это позволяет проводить интерпретацию археологических данных в отношении носителей этих признаков, их принадлежности к определённым родам и племенам, связанных родственными взаимоотношениями. Аналогично, популяции, передвигаясь, приводили к перемещению языков, диалектов, и определение общих предков и времён их жизни даёт возможность прослеживать динамику языков в отношении соответствующих родов и племён, связанных родственными взаимоотношениями.

Вопрос 18: Можно ли привести примеры предковых гаплотипов, датируемых десятками и сотнями тысяч лет назад? Можно ли выявить гаплотип общего предка всех мужчин на Земле?

«Общий предок всех людей» – понятие скорее концептуальное, чем буквальное, абсолютное. Чем больше накапливается данных, тем понятнее становится, что «общий предок всех людей» теряется среди переплетений ДНК-генеалогических линий, уходящих на сотни тысяч лет вглубь. Поэтому введенное некоторое время назад понятие «хромосомный Адам» не является научным и никогда не было доказано. Интуитивно, такой общий предок возможен, но он, скорее всего, будет «плавающей мишенью».

Понятие «одного предка» можно рассматривать на разных уровнях сложности. Например, древнейшая африканская линия (гаплогруппа А00) имеет общего предка с гаплогруппой R1a примерно 210 тысяч лет назад, то есть оттуда, из такой глубины тысячелетий расходятся гаплотипы современных носителей гаплогруппы A00 и этнических русских гаплогруппы R1a:

13 11 12 10 11 16 10 8 14 14 8 8 8 9 12 11 12 8 12 12 11 11 (А00)

12 12 11 11 11 11 11 8 17 17 8 10 8 12 10 12 12 8 12 11 11 12 (R1a)

Здесь приведены 22 очень «медленных» маркера Y-хромосомы, каждый из которых мутирует раз во многие тысячелетия. Можно подсчитать, что эти гаплотипы разошлись на 26 мутаций, и расчеты, основанные на скорости мутации каждого маркера, показывают, что эти 26 мутаций соответствуют времени жизни их общего предка примерно 210 тысяч лет назад. Но даже беглый взгляд на эти гаплотипы показывает, что ДНК древнейших африканцев и этнических русских, носителей гаплогруппы R1a, не так уж намного различаются, или, скорее, являются принципиально сходными.

Хорошо, а если вместо типичного гаплотипа R1a подставить гаплотип R1b, преобладающей гаплогруппы Западной Европы? Мутации здесь настолько медленные, что в таком формате представления гаплотипа он будет практически одинаков по всей Западной Европе:

11 12 13 11 11 12 11 9 15 16 8 10 8 12 10 12 12 8 12 11 11 12 (R1b)

Мы видим, что при таком разрешении большая часть аллелей (это – числа в гаплотипах) у R1a и R1b одинаковы (совпадают 16 аллелей из 22). Между гаплотипами А00 и R1b – 24 мутации, что снижает возраст общего предка на семь тысяч лет, то есть на 3 %. Это – в пределах погрешности расчетов. Только не стоит строить пропорции, там счет нелинейный.

Можно ли считать, что общий предок человечества жил 200210 тысяч лет назад? Вряд ли, поскольку гаплогруппа А00 была обнаружена всего два года назад, и до этого считали, что общий предок человечества жил 140 тыс. лет назад. Если завтра исследователи найдут новую гаплогруппу, то срок начала человечества опять отодвинется. И он несомненно будет отодвигаться дальше, по мере углубления наших знаний. Уже появилась еще одна реперная точка – это общий предок шимпанзе и человека. У современного шимпанзе из полной хромосомной последовательности удалось определить 16 маркеров Y-хромосомы.[31] Они показаны рядом со значениями аллелей в тех же маркерах Y-хромосомы «усредненного общего предка» человека:

8 15 10 4 5 9 10 5 10 4 4 7 4 4 8 9 (шимпанзе)

11 12 11 11 10 8 10 8 12 10 12 12 12 11 11 11 (человек)

Это оказались еще более медленные маркеры, и 64 мутации (!) между ними помещают общего предка шимпанзе и человека на глубину времен в 4.4 миллионов лет назад. В целом это же дают и антропологические оценки. Что важно – никаких «инопланетян» в создании современного человека не было, вместо этого имеется непрерывный эволюционный путь от общего предка шимпанзе и человека миллионы лет назад к нам, современным людям.

Вопрос 19: Можно ли считать, что все люди – родственники?

Как было отмечено в ответе на предыдущий вопрос, концептуально – да, но детали нам пока неизвестны. Если даже мы не найдем конкретного общего предка всех людей на Земле, как мужчин, так и женщин, но принципиальное сходство гаплотипов позволяет предполагать, что все люди произошли от одного общего предка. Если даже мы сможем найти нескольких, которых не сумеем свести к одному общему предку, все равно – опять интуитивно – он и она должны быть. В общем, дело опять сводится к определениям, как мы понимаем «общего предка».

Этот предок оказался древнее, чем предполагалось раньше. Еще недавно считалось, что он жил примерно 70 тыс. лет назад, потом 120 тысяч, потом 140 тысяч, сейчас он уже уходит глубже 200 тыс. лет назад, постепенно приближаясь к общему предку с неандертальцем 300–500 тыс. лет назад, и, возможно, уйдет еще далее к приматам, миллионы лет назад. Как мы видим, гаплотипы хоть и отдаленно, но в принципе похожи на те, что есть у всех нас. У шимпанзе и у нас – одни и те же маркеры. Следовательно, общий предок был один и тот же, только очень древний. И действительно, геномный анализ показывает, что шимпанзе из зоопарка и любой современный человек, мужчина или женщина, имеют более 95 % совпадений в составе их ДНК, или в числе и положениях мутаций, как ни считать.

Вопрос 20: Насколько различаются гаплотипы у разных популяций? Как связать гаплотипы с субкладами?

Как уже сообщалось выше, гаплотипы изображают в виде числа тандемов, или повторов, по каждому маркеру, выбранному из десятков и сотен. В англоязычной литературе их называют STR, или Short Tandem Repeats. Самый простой и короткий гаплотип из тех, которые рассматривает ДНК-генеалогия, состоит из пяти или шести маркеров. Примеры были показаны выше. Но можно привести и еще —

у этнических русских, славян с Русской равнины (индекс субклада R1a-Z280)

16 12 25 11 11 13,

у скифов из раскопок в Минусинской котловине, с датировками 3800–3400 лет назад (индекс не определяли),

16 12 25 11 11 13

в высших кастах Индии (R1a-Z93-L342.2-L657) точно такая же, как у скифов

16 12 25 11 11 13,

у современных таджиков гаплогруппы R1a

16 12 25 10 11 13

(хотя число 10 там при усреднении практически равно 10.5, и при добавлении гаплотипов может склониться или к 10, или к 11),

у носителей гаплогруппы R1a, наиболее распространенной у пуштунов Афганистана (индекс R1a-Z93-L342.2-Z2124)

16 12 24 11 11 13

у западных славян (индекс R1a-M458-L260)

17 12 25 10 11 13

Потомки древних носителей гаплогруппы R1a-M458 сейчас живут в основном в Белоруссии, Польше, на Украине, продвинулись в Центральную Европу; возможно, это они были первыми кельтами в Центральной Европе (в частности, в Австрии, образуя ядро гальштаттской археологической культуры). Как мы видим, 6-маркерный гаплотип уже другой, и легко отличается.

Продолжим:

у славян «центрально-европейской группы» (R1a-M458-CTS11962)

16 12 25 10 11 13

у 60 % западноевропейцев, носителей гаплогруппы R1b

14 12 24 11 13 13

Видно, что в ряде случаев у носителей той же гаплогруппы R1a даже короткие гаплотипы немного различаются, часто всего на одну мутацию, потому что они принадлежат разным субкладам, то есть племенам, с разной историей миграций, и с разными общими предками для каждого племени, хотя имеют одного общего предка гаплогруппы (R1a в данном случае). Поэтому надо всегда уточнять, о каком общем предке идет речь. Как уже говорилось выше, с расширением степени родства общий предок уходит в глубь времен, но он всегда есть.

Посмотрим, как это выглядит на сокращенной диаграмме субкладов гаплогруппы R1a c добавлением R1b:


У каждой из этих гаплогрупп и субкладов был свой общий предок, и у каждого – свой гаплотип. Как мы уже увидели, 6-маркерные гаплотипы разделяют только тех общих предков, родоначальников, патриархов своих субкладов, у которых случайно проскочила мутация в тех самых 6-маркерных гаплотипах. Но у близко расположенных субкладов мутация – чисто статистически, неупорядоченно – могла и не проскочить. Так, мы уже видим, что восточные славяне Русской равнины (субклад R1a-Z280) – близкие родственники ариям (точнее, их потомкам из высших каст Индии) и скифам (ископаемые ДНК), у них одинаковые 6-маркерные гаплотипы. А в гаплотипы пуштун, происходящих из исторической Бактрии, и западных славян, с которыми восточных славяне разделены десятью тысячами лет, неупорядоченные ошибки при копировании Y-хромосомы успели добавить за это время одну-две мутации. В гаплотипах R1a и R1b, которые разделены во времени десятками тысяч лет, уже есть пять мутаций разницы. Формальный расчет дает 5/0.0074 = 676 ? 1580 условных поколений, то есть 40±18 тысяч лет расстояния между ними. Так оно в общем и получается, в пределах погрешности расчетов, между ними примерно 44 тысячи лет разницы.

Схема выше – предельно сокращенная, на самом деле в ней десятки уровней. Мы просто выделили кратчайший путь к ряду субкладов от образования исходной гаплогруппы R1a, которое произошло примерно 20 тысяч лет назад. От R1a последовательно отходили ветви новых и новых субкладов, в основе каждого была новая мутация в Y-хромосоме новорожденного мальчика, мужские потомки которого выжили и в итоге дали свое разветвленное потомство.

Примерно 5500 лет назад в Европе образовался так называемый юго-восточный субклад Z93, носители которого (потомки очередного мальчика, в Y-хромосоме которого образовалась мутация Z93) прошли на Русскую равнину, примерно 4800 лет назад там образовался очередной субклад L342.2/Z94, носители которого разошлись по нескольким направлениям. Одна часть продвинулась в Индию, с новообразованным субкладом L657, это были легендарные арии, и потомки индоариев в настоящее время продолжают нести в своих ДНК мутацию под индексом L657. Потому носителей L657 так много в высших кастах Индии, до 72 % от общего количества. Другая часть продвинулась в Бактрию, но субклады таджиков пока малоизвестны. Тем не менее, датировка общих предков таджиков гаплогруппы R1a указывает на исторических ариев как их потоков. Еще одна часть ариев прошла в Иран и Афганистан, но у них был уже другой, «параллельный» субклад Z2124, которые сейчас имеют большинство пуштунов.

В итоге мы имеем две параллельные системы отсчета времен миграций и определения их направлений – гаплотипы (с их STR, маркерами, тандемными повторами блоков нуклеотидов) и субклады (с их SNP, снипами). Мутации в них происходят независимо друг от друга, по поскольку эти процессы идут параллельно, в одних и тех же популяциях, то в целом между мутационной динамикой в гаплотипах и субкладах есть некоторая корреляция. Мы уже видели, что и 6-маркерный гаплотип сдвинулся на одну мутацию между индусами и афганцами, носителями гаплогруппы R1a, и субклады сдвинулись тоже.

Мы видим, что даже короткие, 6-маркерные гаплотипы являются вполне информативными, и позволяют распознать представителей разных народов и (порой) этносов. Более протяженные гаплотипы, вплоть до 67– и 111-маркерных, позволяют уточнить картину, выявить более недавние ДНК-генеалогические линии, определить их датировку. Но суть поиска от этого принципиально не меняется, появляется намного более высокое разрешение в исследованиях.

Вопрос 21: Какова скорость мутаций в самых коротких, 6-маркерных гаплотипах?

Как уже пояснялось выше, гаплотипы показывают число повторов нуклеотидных участков в маркерах, которые в 6-маркерных гаплотипах обозначают соответствующими индексами 19, 388, 390, 391, 392 и 393. Например, у большинства афганцев гаплогруппы R1a в первом маркере (номер 393) было найдено 13 повторов определённой последовательности нуклеотидов. Во втором – 24 повтора уже другой последовательности и так далее. При передаче этого гаплотипа от отца сыну с вероятностью примерно 0.7 % процента (то есть в среднем у одного на 135 рождений) может произойти мутация, например, такая – от гаплотипа

13-24-16-11-12-11

в такой:

13-25-16-11-12-11

А может произойти и такая -

13-24-15-11-12-11

Примеры таких мутаций можно найти в изобилии, тысячами. Может пройти и любая другая (как правило, одиночная, то есть на один шаг) мутация в любом маркере, только одни мутации в одних маркерах происходят чаще, в других – реже. А в среднем мутация в таких 6-маркерных гаплотипах происходит, как было найдено, в среднем раз на 135 мальчиков. Если перевести во времена, то константа скорости мутации в 6-маркерных гаплотипах равна 0.0074 мутаций на весь гаплотип за 25 лет.

Вопрос 22: Насколько обосновано положение, что по числу мутаций в гаплотипах можно определять «возраст гаплотипа», и не странно ли последнее понятие, поскольку речь о гаплотипах наших современников?

Действительно, «возраст гаплотипа» это жаргон, речь идет о времени, прошедшем со времени жизни общего предка рассматриваемой популяции. Иначе говоря, сколько времени прошло от предкового гаплотипа до гаплотипа его прямого потомка, нашего современника. То есть речь идет опять о времени до общего предка. Это и есть синоним жаргонного понятия «возраст гаплотипа».

Действительно, по числу мутаций в гаплотипах можно определять возраст гаплотипа, то есть время, прошедшее от общего предка этого гаплотипа до его сегодняшних потомков. Поскольку сыновья в подавляющем числе случаев сохраняют гаплотип отца, переданный по наследству, и мутации в этом гаплотипе проскакивают в среднем только раз примерно в 3375 лет (6-маркерный гаплотип) или раз в 1250 лет (12-маркерный гаплотип), или раз в 125 лет (111-маркерный гаплотип), то даже через 5000 лет у потомков сохранится 23 % исходного 6-маркерного гаплотипа, без изменений. То есть в списке из 100 гаплотипов потомков – 23 гаплотипа будут такими же, какой был у предка 5000 лет назад. Это несложно проверить, применяя логарифмический метод [ln(100/23)]/0.0074 = 199 условных поколений (по 25 лет), то есть примерно 5000 лет. На самом деле 23 гаплотипа из ста сохранятся заметно дольше, чем пять тысяч лет, потому что в гаплотипах время от времени происходят возвратные мутации, как бы «стирающие» мутации, образовавшиеся к тому времени. Расчет показывается, что 23 гаплотипа (6-маркерных) из ста сохранятся через 199 ? 227 условных поколений, то есть через 5675 лет. Здесь стрелка показывает поправку на возвратные мутации. Их мы будем рассматривать ниже в этой книге.

При рассмотрении 12-маркерных гаплотипов те же 23 % гаплотипов предка сохранятся через 73 поколения (без поправки на возвратные мутации), или 78 поколений, то есть 1950 лет.

Таким образом, определить гаплотип предка можно и через тысячелетия. И по его виду можно узнать, из каких краёв предок пришёл, сравнив вид гаплотипа с гаплотипами по территориям, и с доступными ископаемыми гаплотипами.

В качестве примера стабильности гаплотипов можно привести 25-маркерные гаплотипы дяди и племянника (гаплогруп-па R1b-U152), которые оказались идентичными (это гаплотипы KLIN00012 и 00013 в базе данных Академии ДНК-генеалогии):

13 25 15 11 11 11 12 12 12 12 13 28–19 9 10 11 11 25 14 19 29 15 15 16 17

Как видно, за три поколения, разделяющих дядю и племянника, 25-маркерный гаплотип полностью сохранился. Действительно, расчеты показывают, что в среднем одна мутация между двумя 25-маркерными гаплотипами случается только на протяжении 11 поколений: 1/2/0.046 = 10.87 условных поколений (по 25 лет каждое; 0.046 – константа скорости мутации в 25-маркерных гаплотипах). Можно было бы написать «в среднем через 11 поколений», но это было бы по сути неверно, так как мутация может произойти неупорядоченно и когда угодно, но при наличии большого числа опытов она происходит в среднем раз в 11 поколений.

Вопрос 23: Можно ли по гаплотипам определять этносы?

Как правило, нет. Гаплотипы не указывают на этносы, это совершенно разные понятия. Гаплотипы указывают на древние рода, племена, которые намного старше этносов. С тех древних времен гаплотипы давно разошлись по разным территориям, на которых потом, через тысячелетия сформировались этносы. Хотя нередко бывают ситуации, когда относительно молодой этнос имеет характерный гаплотип, который мутировал всего лишь незначительно (то есть относительно недавно) от общего предка, и легко узнается. Например, таким характерным является гаплотип евреев гаплогруппы R1a. Он вошел в еврейскую среду субкладом Z2124 (тем самым, который мы видим у афганцев) примерно 4000 лет назад, но у афганцев этот субклад появился только в начале нашей эры. 1300 лет назад группа евреев, носителей этого субклада, к которому за прошедшие тысячелетия добавилась мутация М582 (и цепочка субкладов евреев приобрела вид R1a-Z93-L342.2-Z2124-M582), по каким-то причинам почти полностью вымерла, видимо, была группой компактной, и выживший носитель мутации М582 фактически опять начал свой род. Поскольку это было всего 1300 лет назад, то гаплотип в значительной степени сохранился до настоящего времени, и сейчас почти у всех евреев гаплогруппы R1a, а их многие тысячи, гаплотип (в 67-маркерном формате) имеет вид:

13 25 16 10 11 14 12 12 10 13 11 30 – 14 9 11 11 11 24 14 20 30 12 12

15 15 – 11 11 19 23 14 16 19 20 35 38 14 11 – 11 8 17 17 8 12 10 8 11

10 12 22 22 15 10 12 12 14 8 14 23 21 12 12 11 13 10 11 12 13

В среднем, у всех евреев, носителей этого гаплотипа, наблюдается всего 6 мутаций (на 67 маркерах) от предкового гаплотипа с возрастом 1300 лет. Поэтому данный гаплотип распознается с одного взгляда опытного специалиста. В нем есть характерные только для данного гаплотипа фрагменты.

У афганцев есть тоже характерные по виду гаплотипы. Например, в гаплогруппе G2 в Афганистане преобладает субклад G2b1, c коротким 6-маркерным гаплотипом

13 23 16 11 12 11

а на Кавказе преобладает субклад G2a1, с гаплотипом

14 22 15 10 12 10

Здесь различия множественные, поскольку общий предок обоих субкладов жил не менее 15 тысяч лет назад. За это время гаплотипы разошлись столь далеко друг от друга.

Поскольку у каждого племени и в каждом этносе, в каждом регионе можно определять возраст племени и вообще популяции в целом, то можно определять, когда и в каком направлении шли древние миграции.

Вопрос 24: Можно ли сказать, что где определенной гаплогруппы или субклада больше всех, там и их прародина?

Нет, так сказать нельзя, во всяком случае в большинстве случаев. Например, в Ирландии гаплогруппы R1b больше 90 %, но гаплогруппа R1b появилась наиболее вероятно в Южной Сибири, причем примерно 20 тысяч лет назад, а «возраст» гаплогруппы R1b в Ирландии, как и вообще в Европе, менее 5 тысяч лет. Причина – в далеких древних миграциях. Носители гаплогруппы R1b прибыли в Европу в начале III тыс до н. э., причем основная миграция была со стороны Пиреней, и оттуда мигранты довольно быстро заселили Британские острова, и далее распространились по Европе в виде культуры колоколовидных кубков[32]. К настоящему времени уже изучили шесть ископаемых ДНК из культуры колоколовидных кубков, и из них пять оказались R1b, и один – R1, для всех датировки между 4500 и 4100 лет назад[33], времена культуры колоколовидных кубков, как и предполагалось в ранней работе[34].

В периферийных регионах Европы (Пиренейский полуостров, Британские острова) потомки мигрантов быстро приумножили свое количество, и сейчас доля гаплогруппы R1b с нисходящими субкладами составляет там около 90 % или выше, а в центральной Европе произошло значительное разбавление новыми мигрантами, уже других гаплогрупп. В Восточной Европе исторически сложилось так, что там около 50 % составляет гаплогруппа R1a, но там тоже не их прародина, несмотря на высокую долю гаплогруппы. В Финляндии – выше 60 % гаплогруппы N, но это тоже не ее прародина. В Финляндию носители гаплогруппы N пришли со стороны Алтая. В Осетии более 70 % гаплогруппы G2a, но и это не прародина. Состав и доля гаплогрупп складывается тысячелетиями, и отражает определенные исторические процессы, о которых историки во многих случаях и не догадываются.

Полагать, что там, где гаплогруппы больше, там и прародина, это застарелая ошибка популяционных генетиков. С этой ошибки фактически и началась популяционная генетика человека, когда решили, что высокое содержание гаплогруппы R1b в Европе указывает на то, что эта гаплогруппа в Европе и образовалась. Более того, в академической литературе появилась и датировка для образования R1b в Европе – 30 тысяч лет назад. Эту датировку попгенетики тут же стали обильно цитировать, и никто не задавал вопрос – как эту величину определили? На самом деле ее никто не определял, она была просто записана «по понятиям». Это – типичная схема для популяционных генетиков.

Вывод – доля в процентах гаплогруппы в популяции сама по себе означает не очень много, это просто структура современной популяции, то, чем занимаются популяционные генетики. Как отмечалось выше, часто бывает, что доля большая, а общий предок недавний, просто потомки общего предка быстро размножились, условия были благоприятными. Еще пример – доля гаплогруппы R1a в высших кастах Индии достигает 72 %[35], а сама гаплогруппа пришла в Индию с ариями примерно 3500 лет назад. Хотя в самой цитируемой работе по той же порочной «логике» попгенетиков утверждалось, что раз доля гаплогруппы R1a в Индии (то есть в высших кастах) столь высока, то R1a в Индии и образовалась. На что можно с иронией сказать, что поскольку в нашей фамильной деревне Клёсово в Курской области доля гаплогруппы R1a составляет 100 %, то гаплогруппа в той деревне и образовалась.

Поскольку у каждого племени и в каждом этносе, в каждом регионе можно определять возраст племени и вообще популяции в целом, то можно определять, когда и в каком направлении шли древние миграции.

Вопрос 25: Как современные гаплотипы могут указывать, когда и в какую сторону шли миграции тысячелетия назад?

Когда шли миграции (или пребывание данной популяции на рассматриваемой территории) – рассчитывается по временному расстоянию до общего предка популяции на данной территории, причем такие расчеты проводятся для той же гаплогруппы или субклада на разных территориях. Другими словами, проводится картирование территорий на максимально возможных расстояниях, по всему континенту или на нескольких континентах. Если вдоль пути миграции, то есть шлейфа миграций, идет систематическое уменьшение времен до общего предка, то миграция шла в сторону уменьшения времени.

Пример – сопоставление серий гаплотипов гаплогруппы R1b в Средней Азии и в Европе показало, что общий их предок жил 16 тысяч лет назад[36]. Но в Европе общий предок гаплотипов гаплогруппы R1b жил 4800 лет назад (на Пиренейском полуострове) и 4500 лет назад (в центральной Европе). Следовательно, миграции эрбинов, носителей гаплогруппы R1b, шли со стороны Средней Азии на запад, в сторону Европы. Последующие исследования показали, что гаплогруппа R1b в районе Урала и на Русской равнине имела общих предков как минимум 7000 лет назад, на Кавказе – 6000 лет назад, в Месопотамии и на Ближнем Востоке – 5500 лет назад, на Пиренеях – 4800 лет назад. В ходе этого исследования[37] направления миграций и их времена стали более понятны. Датировки ископаемых гаплотипов позволили подтвердить выводы, полученные при изучении современных гаплотипов – на территории ямной культуры (в Самарской области) были найдены костные остатки носителей гаплогруппы R1b с археологическими датировками 5300 лет назад, а в Южной Сибири – костные остатки носителя гаплогруппы R с датировкой 24 тысячи лет назад[38]. В Европе (в Германии) были найдены ископаемые гаплотипы на территории культуры колокололовидных кубков, принадлежащие гаплогруппе R1b с датировкой 4500–4100 лет назад[39]. Интересен и их состав по субкладам – M269, P310/L151, L51, P312, U152. Первый – обычный далекий родительский субклад из Сибири или ближнего Зауралья, два следующих – ближневосточные (образовались примерно 6200 и 5700 лет назад), P312 – ранний иберийский субклад, начальные колоколовидные кубки, U152 – его потомок (время образования примерно 4500 лет назад).

Как видим, времена и направления миграции эрбинов, полученные поначалу с использованием гаплотипов современников, подтвердились на ДНК ископаемых костных остатков.

Еще пример – датировки (по мутациям в гаплотипах) гаплогруппы R1a-Z93 уменьшаются от 5500 лет назад в Европе до 4050 лет назад в Индии (для субклада R1a-Z93-L657, которого в Европе еще не было), то есть по ходу миграционного маршрута появляются и новые, нисходящие снипы. И таких примеров можно приводить множество.

Вопрос 26: Оперирует ли ДНК-генеалогия понятием «раса»?

Понятия «раса» в ДНК-генеалогии нет. ДНК-генеалогические линии поднимаются из глубин тысячелетий, десятков тысяч лет, сотен тысяч лет, а расовые признаки отдельных людей могут кардинально меняться за несколько поколений. Дело в том, что расовые признаки являются продуктом отца и матери, и если родители принадлежат разным расам, признаки расплываются, и через несколько поколений могут измениться до неузнаваемости.

Вот пример (Рис. 3) – как женитьба на русских женщинах всего в трех поколениях сделала из сибирских монголоидов (хакасов) внучек-европеоидов.

Еще пример – раскопки алтайской пазырыкской культуры позволили выснить, как скифы гаплогруппы R1a стали монголоидными всего за несколько поколений. Причина обратная той, что на фотографиях выше. Раскопки показали, что у этих скифов типичные монголоидные митохондриальные ДНК, то есть они женились на местных монголоидных женщинах, и через несколько поколений дети становились монголоидами, при наличии унаследованной по мужской линии гаплогруппы R1a.


Рис. 3. Переход от монголоидов к европеоидам за три поколения

Иначе говоря, мужские гаплогруппы не определяют расу, и напротив, раса не определяет гаплогруппу. В этой ситуации понятие расы в ДНК-генеалогии ничего не дает.

Вопрос 27: Что могло вызывать массовые миграции в древности?

В самом общем виде ответ такой – поиски лучшей доли. Конкретные причины могли быть самыми разнообразными – это и передвижения за уходящим зверем, который давал пищу и одежду, и уход от превосходящих сил неприятеля, но самый мощный, видимо, фактор был резкое ухудшение климатических условий – суровые зимы, наводнения, засухи, надвигающиеся оледенения.

В середине III тыс до н. э., в результате заселения Европы эрбинами, носителями гаплогруппы R1b, разрушилась Старая Европа, погибли процветающие тысячелетиями балканские культуры, и в Европе древние гаплогруппы либо погибли, либо бежали на периферии континента. Это – гаплогруппы G2a, I2a, E1b-V13, R1a. Гаплогруппа R1a передвинулась на восток, на Русскую равнину, но только малым составом. Об этом говорит то, что в Европе древних гаплогрупп R1a практически не осталось, за исключением малых долей процента, а в Восточной Европе гаплогруппа R1a практически обнулилась, то есть прошла бутылочное горлышко популяции, и общий предок практически всех носителей R1a жил примерно 4600–4900 лет назад (по разным выборкам).

Вопрос 28: Произошли ли люди от обезьян?

Произошли, но не от тех обезьян, которых мы видим в зоопарке. Те, что в зоопарке, или резвятся на полянах в Африке или в Азии, или ходят по краю крыши домов в Индии – это продукты эволюционного развития от общих предков их и человека миллионы лет назад. Например, общий предок шимпанзе и человека жил более 4 миллионов лет назад, и тот, что сейчас в зоопарке – прошел свой эволюционный путь, видимо – не самый удачный. Мы, современные люди, произошли от того же общего предка, несколько более удачным образом, правда, не все.

И не только с шимпанзе у нас был общий предок. Был и общий предок и с гориллой, и с орангутангом, и с макакой. Вот как совпадают их нуклеотидные последовательности в ДНК.


Рис. 4. Сопоставление нуклеотидных последовательностей фрагмента Y-хромосомы для современных человека, шимпанзе, гориллы, орангутанга и макаки (цит. в статье[40]).

Как видно, из 97 нуклеотидов показанной последовательности Y-хромосомы у современного человека и шимпанзе не совпадают только четыре, то есть совпадение наблюдается в 96 % нуклеотидов. Совпадение с гориллой – в 93 % нуклеотидов. Случайных совпадений до такой степени быть не может, мы – родственники, правда, весьма отдаленные.

Многие, даже в научной литературе, педалируют тот факт, что мы не можем найти «пропущенные звенья» эволюции, и что это якобы ставит под сомнение теорию эволюции. Да, найти их было бы интересно, но приведенные выше данные по геному делают эти «пропущенные звенья» не такими уже и обязательными. Ясно, что они где-то лежат глубоко в земле, но всю землю пока не перекопали, и перекопают не скоро. Тем не менее, новые находки не прекращаются, и каждый раз непредсказуемые. Появятся и пропущенные звенья.

Вопрос 29: Коррелирует ли Y-хромосома с общим геномом?

Когда как. Часто коррелирует, иногда нет. Описано немало случаев, когда у двух родных братьев определяли гаплотипы Y-хромосомы, и они были, разумеется, одинаковы или практически одинаковы, а данные по аутосоме (то есть по рекомбинируемым хромосомам генома) заметно различались. И братья далеко не всегда были похожи друг на друга. Порой напротив, геномные данные были близки, а гаплотипы отличались друг от друга на тысячи лет (при переводе мутаций в хронологические показатели).

Осложняет картину и то, что геномные данные разные исследователи представляют по-разному. И действительно, секвенирование геномов дает списки из десятков, сотен тысяч или миллионы снипов, и существует множество способов, как эти списки наглядно или не очень наглядно представлять. Каждый раз – это по сути поиск вариантов приближения или упрощения общей картины, подгонка приближения к ответу на заданный вопрос.

Например, диаграмма ниже показывает рассортированные мутации в геномах, то есть те самые десятки тысяч снип-мутаций, но сортировку их вели в разных предположениях. Основное предположение – это введение понятия «количество общих предков в популяции», или «количество предковых популяций», которое задается компьютерной программе. Оно определяется индексом К справа на картинке. Один предок – это когда популяция совершенно однородна, чего обычно не бывает. При минимальном количестве двух общих предков картина продолжает быть однородной в китайской «референсной» популяции справа, поскольку увеличение количества предков до пяти картину не меняет – популяция вся однородна, сплошная зеленая полоса. Мы знаем, что такого быть не может, китайцы – одна из самых гетерогенных в мире популяций, для этого досточно хотя бы раз пройтись по любому китайскому городу. Но в данном случае у исследователей так получилось, и печально то, что исследователи обычно вопросы не задают – как получилось, так и получилось. Так работает популяционная генетика.

Та же однородная картина наблюдается у ижемских коми, и в значительной степени у итальянцев (синяя полоса) и финнов из Куусамо, на севере Финляндии (пурпурная полоса). У остальных популяций разрешение нарастает с увеличением количества предполагаемых предковых популяций. Самая нижняя панель на диаграмме – «приглаженная» для пяти предковых популяций. На самом деле авторы ушли и выше, до 12 общих предков, но это картину почти не изменило.


Рис. 5. Влияние количества «общих предков в популяции», задаваемых произвольно (показатель К справа) для геномов ряда популяций (указанных внизу диаграммы).

При максимальном количестве в пять предковых популяций мы видим у русских Центрального региона одну доминирующую популяцию, одну менее значительную, и две-три малозначимых. Та же картина у латышей и эстонцев (у последних – две второстепенных по численности популяции), а также у чехов и немцев, только у них основная популяция – иная, нежели у русских. Поляки – почти то же самое, что русские из Курска и Твери. У финнов – тоже одна превалирующая популяция, которая полностью доминирует в провинции, и несколько менее выражена в столице, что в целом понятно. Столица – это обычно конгломерат популяций.

Ижемские коми значительно отличаются от прилужских, первые – почти однородны, у вторых – две почти одинаковые компоненты, у вепсов даже три почти одинаковые, что похоже на картину русских из Мезени, где половина финно-угров. Картина для «стандартного генома русских», что из Архангельской области – промежуточная между русскими Центрального района и вепсами.

Интересно, что авторы цитируемой здесь статьи даже не пытались дать интерпретацию этим картинам. Они ограничились тем же словесным описанием, как я предварительно дал выше, только называли цветные полосы «финской компонентой», «коми-компонентой», и так далее. А ведь интерпретация напрашивается сама собой. Эти полосы – в значительной степени доли гаплогруппы Y-хромосомы в мужских популяциях. Если сказать это попгенетикам, то они занервничают и зашумят, мол, причем здесь Y-хромосома, здесь вообще другие 22 хромосомы, перед которыми Y-хромосома по размеру что мышь перед слоном, здесь десятки тысяч мутаций, которых в Y-хромосоме вообще нет, и среди тех 615 человек половина (наверное) женщин, у которой Y-хромосомы вообще нет.

Я отвечу, что это все прекрасно понимаю, но предпочитаю работать не по понятиям, а по науке. А мне выставляют понятия, из «общих соображений». Покажите, что у меня выводы неправильные. А они сводятся к тому, что хвост в данном случае управляет собакой, то есть Y-хромосома, точнее, ее гаплогруппы – геномными закономерностями в популяциях. А вот почему это так – отвечать надо генетикам. Отвечать по существу, а не возражать «по понятиям». Открытия «по понятиям» не делаются. Открытия обязаны быть непредсказуемыми и для всех неожиданными, иначе это не открытия.

Вот – данные по гаплогруппам, которые попгенетики в цитируемой статье и не рассматривали. А зачем? Компьютер знает, что делает, не так ли? У финнов – три четверти гаплогруппы №с, ее мы и видим в виде пурпурной полосы. В провинции, на севере Финляндии – ее больше, а в столице, Хельсинки, меньше. Другой, желтой полосы, в столице примерно 20 % – это гаплогруппа R1a. Действительно, по Финляндии в целом примерно 10 % R1a, в столице – больше.

У русских центрального района основная гаплогруппа – R1a, что и показывает та же самая желтая полоса. В Курске ее 63 %, в Твери – почти столько же, что и видно на диаграмме. Немало R1a в Латвии и Эстонии, около 40 %. Хотя диаграмма показывает побольше, но мы понимаем, что эти все данные полуколичественные, и погрешности возможны с обеих сторон. В Польше доля R1a – как в Центральной России, что диаграмма и показывает. В Германии – примерно 20 %, на западе меньше, на востоке – больше. Это тоже в целом сходится с диаграммой. Как и то, что у чехов около 40 % R1a. У итальянцев Тосканы – всего 2 % R1a, что мы и видим на диаграмме, на которой представлены данные именно из Тосканы.

Короче, совершенно очевидно, что желтая полоса на диаграмме – это доля гаплогруппы R1a. Так что на возможные протесты попгенетиков я просто посоветую им лучше подумать, как это иначе объяснить. Уверяю, что другого конкретного объяснения от них не поступит. Возражения, что это «так случайно совпало» я не принимаю, пока мне не объяснят, что такое желтая полоса «не случайно».

У ижемских коми никто R1a не измерял, но по диаграмме видно, что ее у них почти нет, из тестированных 96 человек будет у одного-двух. У прилужских коми, как и у вепсов, и у популяции Мезени, судя по диаграмме, будет процентов тридцать. А вот и данные – действительно, у коми выявлено 33 % R1a, а у каких именно коми – мне неизвестно. Возможно, что у прилужских. Или у других. У вепсов не измеряли. У мезенцев – 44 % R1a, как примерно и на диаграмме.

Голубая полоса – это определенно гаплогруппа R1b, поскольку у итальянцев она доминирует, как и показано на диаграмме. В Германии ее примерно 40 %, у чехов чуть меньше, у всех остальных на уровне единиц процентов, что и видно на диаграмме.

Зеленая полоса – гаплогруппа О, она наиболее выражена в Китае, в Европе ее практически нет, что диаграмма и показывает.

Теперь красная полоса. Для нее остается только два варианта – гаплогруппа I (без разрешения на I1 и I2), или уральская, угорская гаплогруппа N1b. Действительно, у итальянцев первой всего 1–3% и вовсе нет второй, что и показывает диаграмма. У остальных – на уровне единиц процентов, как и видно из диаграммы. По данным диаграммы этой гаплогруппы, особенно N1b, должно быть много у тестированных северных народностей. Действительно, в Красноборске Архангельской области гаплогруппы I 22 %, в Вологде – 20 %, и гаплогруппы N1b 3.3 %. Судя по диаграмме, у тестированных прилужских коми ее должно быть примерно 40 %, но в одной из статей 2009 года гаплогруппы N1b у них всего 15 %, но 50 % гаплогруппы N1c1. У ижемских коми ее должно быть, по диаграмме, почти 100 %, но опять же, думаю, что не определяли.

Похоже, что у ижемских коми популяция молодая, всего несколько сотен лет. И вся она – только одна гаплогруппа, либо I1, либо N1b. Потому и однородна. Но поскольку популяционные генетики датировки не определяют, не рассчитывают, делать они этого не умеют, то только будущие исследования подтвердят мою точку зрения. Другого варианта не вижу.

Так что интерпретация диаграммы приобретает довольно простой вид. Получается, и в данном примере не в первый раз, что Y-хромосома, как паровозик, тащит за собой – в отношении картины мутаций – остальные 22 хромосомы, но то, что общая картина мутаций в данном случае отражает долю мужских гаплогрупп Y-хромосомы, это бесспорно. Отвергнуть это просто невозможно, можно только внести некоторые коррективы.

Популяционные генетики представляют те же данные и по-другому, диаграмма ниже. Она строится по другим принципам, здесь геномные картины мутаций растягиваются в двух направлениях, что и дает показанную ниже двумерную диаграмму. По ней видно, как популяции располагаются по степени близости (или отдаленности) друг по отношению к другу.

Теперь, зная, что эти картины отражают в основном мужские гаплогруппы, интерпретировать их довольно легко. Заметим опять, что авторы статьи их так не интерпретировали, ограничиваясь просто констатацией того, что увидели. Типа – вот что мы получили, смотрите. И что же мы видим?


Рис. 6. Двумерная диаграмма, показывающая степень близости (или удаленности) популяций, описанных в другом виде на рис. 5.

Мы видим, что популяции с близким набором мужских гаплогрупп, в которых доминирует (или значителен по представительству) R1a, образуют один кластер. Это – русские Курской, Владимирской, Тверской областей, латыши, немцы, чехи. Там же – эстонцы, которые начинают вытягиваться в сторону финнов (что неудивительно, у эстонцев – треть гаплогруппы N1c1), а именно в направлении финнов Хельсинки, и далее полоса уходит к финнам северной провинции, у которых должен быть максимум N1c1. То есть этот трек диаграммы, в левую сторону вверх, совершенно понятен. Как понятен и хвост этого трека – там крайний справа одинокий кластер итальянцев с максимальным содержанием гаплогруппы R1b. Других таких в рассматриваемых популяциях нет. Были бы ирландцы или баски – попали бы в компанию с англичанами. Вот пусть попгенетики это и проверят.

Симметрично, слева вниз уходит другой трек – предположительно в сторону увеличения содержания гаплогруппы I или N1b. Предположительно – потому что таких данных мало, но основных гаплогрупп больше не остается. К тому же гаплогруппы I и N1b на русском севере есть и немало (см. выше). Сначала вниз и влево пошел «референсный русский геном», который, как и описывалось выше, скорее угро-финский. В том же направлении потянулись вепсы и Мезенская популяция, с ее 7.4 % гаплогруппы N1b (в Пинеге 15.8 %), и далее коми – прилужские, и в конце трека – ижемские.

В целом же исследование полезное, оно позволяет понять, что лежит в основе вариаций в геноме, задающих глубинные различия между популяциями. Эти различия идут из тьмы тысячелетий, и что особенно интригует – они определенно завязаны на мутации, определяющие мужские гаплогруппы. Это – совершенно новая концепция, и решать эту загадку надо в содружестве генетиков и ДНК-генеалогов.

В сети нередко приходится встречать «мнения», в том числе и от биологов по образованию, которые пишут (цитата) – «Y-хромосома является ничтожной частью генома, и ее совпадения ни о каком реальном родстве не свидетельствуют». Автор той цитаты тоже рассуждает «по понятиям», и плохо знаком с литературой по этому вопросу. Да, собственно, здесь дело не столько в литературе (авторы статей тоже часто пишут «по понятиям»), сколько в собственном рассмотрении данных. Если опыта нет, то мнение ровным счетом ничего не стоит.

Вопрос 30: Есть ли «русская ДНК» или «русский геном»?

Говоря об отдельных людях – нет. Если говорить о большой группе этнических русских – в целом есть. Собственно, пример, описанный в предыдущем разделе, это показывает. И понятно, почему есть. Свои обычно, статистически, женятся на своих, как и выходят замуж. Вряд ли в русских деревнях встречали много чернокожих, монголов, австралийских аборигенов или американских индейцев. Поэтому в целом одни и те же огромные наборы снип-мутаций крутятся в популяции веками, вносимых мужчинами и женщинами этой популяции. Если построить карту мира, состоящую из таких популяций, то африканские будут совершенно отличны от монгольских, китайских, латиноамериканских, или европейских. Здесь я пишу «европейских» более осторожно, потому что разойдутся ли они по разным «цветам», или останутся однородными по всей Европе зависит от того, как представлять данные, на каком уровне обработки и приближения. Нередко бывает, что, например, русских от французов не отличить, но если перейти на другой уровень обработки данных, то различаются.

Вопрос 31: Каковы перспективы геномного анализа популяций и их истории?

В целом перспективы у популяционного анализа геномных данных – но это все равно пока не ДНК-генеалогия – огромные, но пока мы находится в самом начале этого пути, идя методом проб и ошибок. Примитивизм обработки данных и получаемых выводов порой просто шокирует, хотя сами исходные данные определенно замечательны. Срезание углов и шапкозакидательство в науке никогда не помогали. К сожалению, у популяционных генетиков не принято при анализе генома давать погрешности расчетов, приводить альтернативные варианты интерпретаций данных, и воздерживаться от мнений, которые в избытке вбрасываются в статьи. В итоге достоверность полученных интерпретаций часто не просто нулевая, а имеет отрицательную величину. Целый ряд рассмотрений подобных статей с «геномным анализом» приведен на сайте «Переформат» – http://pereformat.ru/klyosov/

Например, недавно (2015) по миру прошла широковещательная информация, что геномные данные показали, что носители гаплогруппы R1b из ямной археологической культы (нынешняя Самарская область) принесли в Европу индоевропейские языки. Там что ни слово, то недоразумение. Во-первых, авторы не получили никаких данных, что носители ямной культуры (примерно 5300 лет назад), гаплогруппа R1b, говорили на индоевропейских языках, это было просто придумано. Да и как могли получить? Выкопаннные кости они и есть кости, они не говорят. Всё, что определили, это то, что ДНК в них относилась к гаплогруппе R1b. Далее, то, что носители той ДНК/R1b пришли из ямной культуры в Европу (и принесли ИЕ языки), было провозглашено только на том основании, что в Европе много гаплогруппы R1b. Иначе говоря, авторы просто провели прямую линию между ямной культурой и Европой. Они даже не посмотрели на то, что они нашли не просто R1b, а ее субклад R1b-Z2103/Z2105, которого в Европе почти нет. Миграционный путь субклада Z2103/Z215 был не в Европу, а на юг, в Месопотамию и на Ближний Восток, где этого субклада множество, причем с той же датировкой 5000–6000 лет назад. Но в Месопотамии сейчас нет индоевропейских языков, как нет нигде на миграционном пути гаплогруппы R1b из Южной Сибири в Европу, с основным входом через Пиренейский полуостров, где у басков имеется около 90 % гаплогруппы R1b, и язык опять неиндоевропейский.

Это, к сожалению, типичный пример, как популяционные генетики используют геномный анализ для «изучения истории». Много других – на сайте http://pereformat.ru/klyosov/.

Вопрос 32: Насколько точны (или неточны) расчеты в ДНК-генеалогии?

Отвечу в два приема. Эта часть ответа – скорее качественная, концептуальная. Вторая часть, количественная, будет в разделе «Расчетные методы ДНК-генеалогии» (Часть II).

Все расчеты в ДНК-генеалогии производятся с погрешностями. Точные цифры получены быть не могут в принципе. Дело в том, что мутации неупорядоченные, поэтому мы имеем дело со статистикой.[41] Чем больше выборка, тем точнее расчеты. Чем длиннее гаплотипы – тем точнее расчеты. Погрешность зависит от числа гаплотипов в выборке, от протяженности гаплотипов, от того, насколько точно определена и выверена, откалибрована константа скорости мутации, от того, насколько древний общий предок. Особенно неточно сравнивать мутации в парах гаплотипов, особенно гаплотипов коротких. На двух гаплотипах мутация-другая могла добавиться буквально в предыдущем или нынешнем поколении. Это может сразу привести к прибавлению-отнятию тысячи лет «в одном поколении». А в большой выборке разница относительно нивелируется статистикой. Есть выборки в тысячи гаплотипов – там расчеты, конечно, точнее.

В ДНК-генеалогии часто важна не абсолютная точность, а концептуальный вывод. Например, если некто утверждает, что носители гаплогруппы R1b (которые сейчас составляют примерно 60 % мужского населения Западной и Центральной Европы), жили там, в Европе, еще 30 тыс. лет назад (а такими утверждениями популяционных генетиков, без расчетов, была заполнена академическая литература по данным вопросам до недавнего времени), а расчеты ДНК-генеалогии показали 4800 лет назад[42], то здесь дело не в точности, а в принципиальном выводе. То же самое по ДНК-генеалогии Кавказа – если данные показывают, что Кавказ заселялся носителями гаплогруппы J2 из Месопотамии примерно 7–6 тыс. лет назад, причем заселялся разными племенами и по разным территориям, и уже известно какими именно, и в какое время, то это дает важные данные историкам и археологам, которые продолжают горячо спорить по данным вопросам. То же самое по ДНК-генеалогии Прибалтики – данные показывают, что Прибалтика со стороны Финляндии и со стороны Южной Балтики заселялась всего 2000–2500 лет назад (со стороны Южной Балтики примерно на 500 лет раньше), но сами мигранты, которые на исходе миграции разделились на две большие ветви – северная и южная – имеют общего предка примерно 3575 лет назад, который, видимо, жил на Урале[43].

Вопрос 33: В какой степени гаплотипы определяются территориями и регионами?

Гаплотипы в немалой степени (но не всегда) связаны с определёнными территориями. Причина в том, что в древности большинство людей передвигались племенами, родами. Род, по определению, это группа людей, связанных родством, то есть происходят (по мужской линии) от одного общего предка. То есть гаплотипы у них обычно одинаковые или близкие. Как сообщалось выше, одна мутация в среднем происходит за тысячелетия. Проходили тысячелетия, численность родов порой сокращалась до минимума («бутылочное горлышко» популяции), и если выживший имел некоторую мутацию в гаплотипе, то его потомки уже «стартовали» с этой новой мутацией, копируя ее поколениями в своих ДНК, а мужчины – в своей Y-хромосоме. В популяционной генетике это называется «эффект основателя», что, в общем, особой дополнительной смысловой нагрузки не несет, это просто калька с английского языка, в котором это тоже не несет определенной информации. Некоторые люди покидали род по своей или чужой воле – плен, бегство, путешествия, военные походы, и выжившие начинали новый род на новом месте. В итоге карта мира с точки зрения ДНК-генеалогии получилась пятнистой, и каждое пятно порой имеет свой превалирующий гаплотип – гаплотип рода. Часто он и есть гаплотип предка, начавшего род на данной территории.

Вопрос 34: Получается, людей можно классифицировать по виду гаплотипов и снипов?

Да, это именно так. Например, носители гаплогрупп А и В сейчас в основном живут в Африке (но где эти гаплогруппы появились, пока непонятно, похоже, что не в Африке); гаплогруппа С встречается особенно часто среди монголоидов и жителей Австралии и Океании, хотя жители Австралии и Океании далеко не монголоиды (что показывает, в совокупности с другими данными, что первые носители гаплогруппы С были не монголоидны), подгруппы (субклады) далеко отклонились друг от друга в ходе развития или эволюции; гаплогруппу G находят в древней Европе (в основном ископаемые гаплотипы), на Кавказе, в Передней Азии, в Афганистане; гаплогруппа J – образовалась или в древнейшие времене перешла на Ближний Восток, и оттуда многие носители гаплогруппы J и ее субкладов J1 и J2 перешли Кавказ не позднее 6–7 тысяч лет назад; представителей гаплогруппы J1 довольно много на Кавказе, а также среди арабов и евреев на Ближнем Востоке, гаплогруппы J2 много на Кавказе, в Месопотамии и среди жителей Средиземноморья; гаплогруппа L появилась, похоже, в Передней Азии или на Ближнем Востоке, и разошлась в разные стороны – ее подгруппа (субклад) Lia – в Индии, Lib – в Грузии, Lic – в Афганистане, в северном Пакистане, на восточном Кавказе.

Гаплогруппу N имеют многие жители Китая, Сибири, севера России, Прибалтики и части Скандинавии, куда и прибыли носители гаплогруппы N с востока – Урала и до того Южной Сибири тысячелетия назад.

Гаплогруппа I – возможно, имеет историю на Русской равнине продолжительностью не менее 40–45 тысяч лет, и после почти полного вымирания или истребления примерно 4500 лет назад сейчас почти исключительно находится в Европе, где возродилась относительно недавно, 3700–2300 лет назад (для I1 и части I2, соответственно).

Гаплогруппы R1a и R1b появились в Южной Сибири после долгой миграции их предков, носителей гаплогруппы К, из которой образовалась гаплогруппа Р и затем Q и R, возможно, из Европы или с Русской равнины на восток, далеко за Урал. Оттуда гаплогруппы R1a и R1b пришли в Европу, причем разными миграционными путями. R1a стала основной гаплогруппой Восточной Европы, R1b – западной и центральной Европы.

Данное положение сводится к тому, что у каждого мужчины есть снип из определённого набора, по которому можно отнести носителя к определённому древнему роду. Времена появления снипов, обычно применяемых в ДНК-генеалогии, относятся к диапазону от 25–40 тысяч лет для «старых» снипов до 10–15 тысяч лет для «молодых», но сейчас уже выявляют снипы, образовавшиеся всего 600-1000-1500 лет назад. Четверть всего ирландского мужского населения имеют снип (R1b-M222), который образовался примерно 4300 лет назад, но прошел бутылочное горлышко популяции в начале нашей эры, и общий предок этой четверти населения жил всего 1800 лет назад. В континентальной Европе снипа М222 практически нет.

Для иллюстрации положения о снипах стоит еще раз взглянуть на сокращенную диаграмму субкладов гаплогруппы R1a, приведенную в ответе на 20-й вопрос.

Вопрос 35: Сколько всего имеется основных родов, или гаплогрупп человечества?

Гаплогруппы не просто соответствуют своим родам, но образуют определённую последовательность, лестницу гаплогрупп[44]показывающих их иерархию – последовательный, ступенчатый переход от точки расхождения африканских и неафриканских популяций (примерно 160 тыс. лет назад) до самой недавней гаплогруппы R, образовавшейся примерно 30 тыс. лет назад. Эта лестница называется филогенетическим деревом гаплогрупп и их снипов. Все гаплогруппы и субклады на дереве должны включать снипы «вышестоящих» гаплогрупп и субкладов. То есть принцип «лесенки» должен выполняться. Преемственность узловых родов человечества должна соблюдаться.

Всего в мире насчитывают 20 основных гаплогрупп, которые обозначают буквами латинского алфавита, от А до Т, хотя систему порой нарушают. В последнее время в классификацию добавили гаплогруппы А0 и A00, хотя их носителей обнаружили в количестве считанных единиц, все они живут в Африке. Но они настолько отстоят по снип-мутациям от всех остальных людей на Земле (тестированных на мутации в ДНК), что их пришлось выделить в отдельный род-гаплогруппу. Помимо этого, были идентифицированы промежуточные, сводные гаплогруппы, такие, как СТ, DE, GHIJK и другие (см. диаграмму ниже), так что минимальный состав генеалогического дерева мужской половины человечества включает уже 39 основных гаплогрупп, то есть главных уровней Y-хромосомной генеалогической структуры. С подгруппами это составляет уже много сотен.

Если же считать все уровни генеалогического дерева (уровень в этом случае – это субклад), то гаплогруппа R1a, основная гаплогруппа (род) этнических русских, уже насчитывает 66 субкладов, гаплогруппа R1b – 443 субкладов, и это при том, что на диаграмме ниже они обе входят в сводную гаплогруппу R, которой примерно 30 тысяч лет со времени образования. Образовалась гаплогруппа R при появлении необратимой мутации в виде спонтанного превращения одного нуклеотида в другой в ДНК (Y-хромосоме) патриарха, или его выжившего потомка, в свою очередь потомки которого дожили до настоящего времени в количестве более миллиарда человек. Если точнее, то у него, патриарха гаплогруппы R, по сравнению с ДНК его отца (относящегося к гаплогруппе Р) произошло спонтанное превращение аденина в гуанин, и это произошло в участке Y-хромосомы под номером 15 миллионов 581 тысяч 983. Всего же в Y-хромосоме мужчин насчитывается, как сообщалось выше, примерно 58 миллионов нуклеотидов.


Всё это делает филогенетическое дерево гаплогрупп достаточно прочной и обоснованной структурой. У него есть, впрочем, слабое место – его филогения не показывает, на каком континенте зародилось человечество, откуда пошли гаплогруппы, начиная с первых, на общем стволе, идущими от нашего общего предка с современным шимпанзе. Говоря языком филогении, дерево гаплогрупп не «укоренено». Укоренение дерева – результат интерпретаций, наблюдений и доступных экспериментальных данных.

Вопрос 36: Можно ли представить ДНК-генеалогическое эволюционное дерево человека с максимально сжатой форме, и дать комментарии для его самой ранней части?

Результаты недавних исследований о происхождении человечества методами ДНК-генеалогии представлены на следующей диаграмме, на которой также показаны времена появления основных Y-хромосомных ветвей человечества.


Рис. 6а. Диаграмма эволюции гаплогрупп современного человечества. На горизонтальной оси – основные гаплогруппы Y-хромосомы человечества, на вертикальной – абсолютная шкала времени. Общий предок альфа-гаплогруппы жил примерно 160 тысяч лет назад, общий предок бета-гаплогруппы (или гаплогрупп от В до Т) – 64±6 тысяч лет назад(из статьи[45]).

Естественно, эволюционное дерево уходит от альфа-гаплогруппы вниз, как это показано в верхней части предыдущей диаграммы, где расхождение гаплогруппы А0-Т на А0 и А1 и соответствует, видимо, расхождению двух ветвей, африканской (по месту прибытия) А0 и неафриканской А1:


Датировка этого расхождения по гаплотипам дает примерно 160 тысяч лет назад, но датировка по снипам пока является менее определенной. Компания YFull, наиболее продвинутая в датировках по снипам, сообщает, что гаплогруппу А00 отделяет от настоящего времени 1684 снипа, и потому дает для образования гаплогруппы А00 время 234900±7700 лет назад, что скорее означает 235000±8000 лет назад, потому что давать датировки с точностью до сотни лет при погрешностях в тысячи лет не является математически корректным. Гаплогруппу A0-T отделяет от настоящего времени 587 снипов, то есть в три раза меньше, но YFull дает для нее те же 234900±7700 лет, только исходя из того, что эти гаплогруппы на дереве «параллельны». Это, конечно, недопустимо, поскольку имеем конфликтные показатели -587 снипов соответствуют примерно 82000 лет, что, конечно, в этой ситуации мало.

Для гаплогруппы A0 компания YFull приводит 899 снипов, но датировки не приводит, хотя это соответствует примерно 125000 лет, если исходить из принятой пропорциональности датировок числу снипов. Для «параллельной» гаплогруппы компания приводит всего 62 снипа, но выставляет датировку 146300 лет, которая в таком случае непонятно, откуда появилась. Все это показывает, что расчеты по снипам пока не устоялись, и потому будем опираться на ранее рассчитанную величину расхождения ДНК-линий от альфа-гаплогруппы примерно 160 тысяч лет назад, как рассчитано по мутациям в гаплотипах.

Примерно 64 тысячи лет назад предки современных неафриканцев прошли «бутылочное горлышко популяции», и именно к этому времени сходятся все изученные до настоящего времени ДНК-линии гаплогрупп от В до Т. Видимо, наиболее обоснованной гипотезой об основной причине обрыва генетических линий неафриканцев 64 тыс лет назад является катаклизм планетарного масштаба, вызванной падением метеора в Тихий океан в указанное время[46]. Он привел к тому, что древние африканские гаплогруппы тоже вымерли и сейчас не обнаруживаются. Поэтому ровно никаких генетических оснований для утверждения, что современное человечество вышло из Африки нет, это просто фантазийная (а скорее, совершенно натянутая) схема. Фактически, она полностью строится на положении, что «африканцы более разнобразны» по Y-хромосомам, чем неафриканцы, но диаграмма выше показывает причины этого более высокого разнообразия. Вторая причина более высокого разнообразия в Африке – что в течение десятков тысяч лет в Африку мигрировали носители практически всех гаплогрупп человечества (например, в Камеруне и Чаде сейчас живут многие носители гаплогруппы R1b, пришедшие туда тысячелетия назад), которые, естественно, увеличивали «разнообразие», смешиваясь с африканцами. Подобная же диаграмма построена и для митохондриальных ДНК, присущих в первую очередь женщинам. Вывод один – предки современных неафриканцев из Африки не выходили, напротив, они прибывали в Африку и увеличивали африканское генетическое разнообразие.

Вопрос 37: Можно ли рассчитать, когда жил общий предок всех сегодняшних людей на Земле?

Можно, с определенной степенью допущений. Первое и самое главное допущение – что общий предок сегодняшних людей на Земле на самом деле существовал. Естественно, речь не идет о том, что на Земле когда-то жил один мужчина, и с ним рядом была одна женщина, как повествует библейская притча. Такого никогда не было. Во все времена было множество мужчин и множество женщин, а до них было множество самцов и самок, предшественников тех самых мужчин и женщин, и переход одних в других занял миллионы лет, и никто не может дать четких определений, в чем выражался этот переход, это все вопросы определений, которых, в общем-то, нет. Да, наверное, никого это отсутствие четких определений особенно и не беспокоит.

Чисто концептуально, «общий предок» всех людей на сегодняшней планете – это тот, потомство которого выжило, в отличие от множества его современников, и продолжилось в потомках до настоящего времени. Помимо этого – это был тот человек, у которого было как минимум два сына, потомство которых выжило до настоящего времени. Как следствие первых двух условий, все потомки унаследовали снип-мутации своего «первопредка», и добавили снип-мутации в последующем. Поэтому есть еще одно условие, точнее, следствие – мутации в гаплотипах потомков при экстраполяции в прошлое сходятся к «первопредку». Таким образом, можно определелить его гаплотип, независимо от того, как давно он жил.

Но в реальности картина более сложная – ДНК-линия от первопредка к сегодняшним потомкам часто выглядит как цепь сосисок в перетяжками во многих местах. Эти места – бутылочные горлышки популяции, и порой перетяжки образуют такие сужения, что при расчетах они тоже формально соответствуют одному человеку, патриарху после прохождения бутылочного горлышка. Иначе говоря, имеем последовательную цепь патриархов. Это легко представить на примере хрестоматийного «последнего из могикан» Фенимора Купера. Вспомним сюжет – от всего племени могикан остался один мужчина. Умрет он – и вся линия ДНК, идущая из глубин, возможно, 12–15 тысяч лет назад, оборвется. Для следующего поколения американских индейцев могикан как бы и не существовало, несмотря на их многотысячелетнюю историю. Но если «последний из могикан» выживет, женится, обзаведется сыновьями – он станет патриархом для последующих поколений его рода.

Подобных случаев в истории Земли было, видимо, неисчислимое количество.

В итоге вопрос про «общего предка человечества» несколько расплывается. В каждой прямой ДНК-линии её общий предок жил относительно недавно – где сотни лет назад, где тысячу-другую лет назад. Но совокупность ДНК-линий, даже только выживших, помещает общих предков на 20–40 тысяч лет назад в каждой гаплогруппе. Совокупность ДНК-линий разных гаплогрупп помещает общего предка неафриканцев на 64±6 тысяч лет назад, до наиболее отдаленного бутылочного горлышка популяции, а африканцев – примерно на 217 тысяч лет назад[47], но это не потому, что африканские предки древнее, а потому что по какой-то причине совокупность африканских (по их нынешнему месту обитания) ДНК-линий прошла бутылочное горлышко популяции намного ранее.


Расчет времени жизни общего предка гаплогрупп A0 и A00 с помощью калькулятора Килина-Клёсова (показан фрагмент калькулятора)

Можно ли считать, что 217 тысяч лет назад жил общий предок современного человечества? Нет, нельзя. Потому что неафриканские и африканские ДНК-линии сходятся к общему предку примерно 160 тысяч лет назад. Именно тогда разошлись африканские и неафриканские (по нынешнему месту обитания) ДНК-линии. Но глубже во времени уходит общий эволюционный ствол африканцев и неафриканцев, который расходится на гаплогруппы А00 и А0-Т примерно 217 тысяч лет назад. У нас нет оснований не считать носителей гаплогрупп А00 и А0-Т членами вида Homo sapiens, так что общий предок современного человечества уходит глубже 217 тысяч лет назад. Но еще глубже, 300-400-500 тысяч лет назад, уже времена образования неандертальцев, которых вряд ли можно считать общими предками современного человечества. Вот и очерчены рамки времен возникновения общего предка современного человечества. Называть его «Адам», чем увлекаются некоторые, нет никаких оснований.

Вопрос 38: Почему в ДНК-генеалогии за поколение принимается 25 лет? Ведь протяженность поколения – величина нестабильная. Как это сказывается на расчетах в ДНК-генеалогии?

Действительно, в расчетах ДНК-генеалогии обычно оперируют поколениями, потому что при расчетах на один год константы скоростей мутации имели бы много нулей, а много нулей увеличивает вероятность ошибки. Например, для 12-маркерных гаплотипов (в стандартной системе FTDNA) величина константы скорости мутации равна 0.02 на гаплотип за условное поколение, или 0.0008 на гаплотип за год, или 0.0000666 на маркер за условное поколение. Условное поколение в контексте ДНК-генеалогии – это событие, которое происходит четыре раза в столетие. Численно и по времени оно близко к продолжительности поколения в житейском смысле этого слова, но не обязательно равно ему. Хотя бы потому, что продолжительность «бытового» поколения не может быть точно или хотя бы в среднем определена, она «плавает» в реальной жизни в зависимости от многих факторов, включая культурные, религиозные и бытовые традиции, примерно и в среднем от 18 до 36 лет, хотя границы этого не определены.

Такие организации, как ООН и ее подчиненные организации, как ЮНЕСКО и другие, как и прочие международные организации обычно принимают в своих подсчетах и рекомендациях продолжительность поколения в 25 лет, это же обычно принимают и демографы, например, в работе[48]. Это все, разумеется, условности, и приняты только для некоторой стандартизации. Популяционные генетики рекоментациями ООН не руководствуются, и, в общем, правильно, но при этом используют продолжительности поколения кто во что горазд. Никакой научной основы в это не закладывают, поэтому уйдя от одних рекомендаций они никаких других не выработали. Только что вышла статья по геномному анализу, там в расчетах применяли 29 лет на поколение, на каком основании – не пояснили[49]. Другие берут от 18 до 35 лет на поколение.

В ДНК-генеалогии произвольные значения продолжительности поколений не используются, поскольку использовать столь «плавающую» величину для расчётов в широких временных диапазонах и для разных народов не представляется возможным или разумным. Исходя из этого положения, скорости мутаций откалиброваны под условно взятое поколение продолжительностью 25 лет.[50] Если кому-то больше нравится 30 лет на поколение или любое другое количество лет, скорости можно перекалибровать, и в итоге окажутся ровно те же величины в годах. Так что сколько лет приходится на поколение – в данном случае не имеет значения, потому что при расчётах меньшему числу лет на поколение будет просто соответствовать пропорционально большее число поколений, и итоговая величина в годах не изменится.

Например, для 67-маркерных гаплотипов средняя константа скорости мутаций равна 0.12 на гаплотип на условное поколение в 25 лет. Поэтому при 120 мутаций на 50 гаплотипов общий предок этих 50 гаплотипов жил 120/50/0.12 = 20 условных поколений назад, то есть 20х25 = 500 лет назад. Если кому-то не нравится величина 25 лет на условное поколение (правда, причины такой нелюбви к 25 годам на поколение будут загадочными), и этот некто захочет использовать 30 лет на поколение, то нет проблем, просто константу скорости мутации придется пропорционально пересчитать, и она получится 0.12x30/25 = 0.144 мутаций на поколение в 30 лет. Тогда для 120 мутаций имеем 120/50/0.144 = 16.666 поколений по 30 лет, или те же 500 лет до общего предка. От чего ушли, к тому же и пришли.

Вопрос 39: Какие требования предъявляются к выборкам гаплотипов для расчетов в ДНК-генеалогии?

Как уже пояснялось выше, если взять любую выборку, тупо считать количество мутаций в гаплотипах, и разделить его на число гаплотипов и на константу скорости мутации, то что-то, конечно, получится. Именно так и проводят «расчеты» популяционные генетики. Но на самом деле там скорее всего получится некое бессмысленное число в поколениях или годах до якобы общего предка. Но откуда известно, что для данной выборки общий предок был один? А ведь так всегда и работают попгегетики, усредняя любые выборки. Поскольку после некоторых проб и ошибок ими было найдено, что таким образом происходит «умоложение» общих предков выборок, то попгенетики не нашли ничего лучшего, как втрое занизить величину константы скорости мутаций. Собственно, они ее «константой» никогда и не называли, просто «популяционная скорость мутаций». Вот так и работали – за счет усреднения время до общего предка занижали в неизвестное число раз, а за счет искусственного занижения «скорости мутаций» его опять увеличивали, правда, опять в неизвестное число раз, по принципу – «авось скомпенсируется». А оно не компенсировалось, а либо получалось значительно заниженным, либо значительно завышенным. Когда общий предок выборки был случайно один, то завышение времени до него составляло обычно 280–350 %. Так и работали, и вот такими завышенными датировками заполонили академические журналы.

Честь нанесения такого ущерба науке, если попгенетику называть наукой, принадлежит Л.А. Животовскому, сотруднику Института общей генетики РАН. На основании какого-то вывиха здравого смысла, эту «популяционную скорость» узаконили после 2004 года, и более десяти лет в академических журналах гнали откровенный мусор. Широко известны «датировки» «общего предка» гаплогруппы R1a в Индии, которые Животовский с соавторами (эстонская школа попгенетики) загнали в 12–15 тысяч лет назад, когда они на самом деле составляют 3500–4000 лет назад, для разных выборок. Это на долгие годы не только затормозило изучение истории ариев в Индии, но и направило изучение истории по ложному пути. Этим отличился, например, некто Семененко из Воронежа, представляющийся как «индолог», для которого главный аргумент для отстаивания этих безумных датировок был, что они опубликованы «уважаемыми людьми», «известными специалистами». Нет и не может быть таких критериев в науке, а если их применять, то только как вторичные, вспомогательные.

Возвращаясь к исходному вопросу, только те мутации в гаплотипах имеет смысл рассчитывать, экстраполируя ко времени общего предка, которые подчиняются определённым количественным закономерностям. ДНК-генеалогия оперирует тремя экспериментальными факторами: 1) наличием снипов, относящих человека к определённому роду; 2) наличием мутаций, позволяющих оценивать время, прошедшее от общего предка совокупности гаплотипов и – при больших выборках – от начала самого рода, от самого далёкого из предков ныне живущих потомков данного рода (то есть здесь считаются сами мутации); 3) закономерностями переходов гаплотипов в их мутированные формы, без численного учёта самих мутаций (то есть здесь мутации не считаются, считаются немутированные гаплотипы).

Это позволяет оценить, насколько достоверны расчёты времени жизни общего предка по мутациям, и даёт ещё один, независимый способ расчетов. Методы, в которых считаются мутации, называются линейным, квадратичным и пермутационным,[51]из которых наиболее прост линейный метод. Метод, в котором считаются немутированные гаплотипы, называется логарифмическим. В принципе, он использует формулы химической кинетики первого порядка (дополнительно вводя поправку на возвратные мутации). В линейном методе общее число мутаций в серии гаплотипов делится на число гаплотипов и на константу скорости мутации для данных гаплотипов, как было показано выше. В логарифмическом методе берется логарифм отношения общего числа гаплотипов к числу немутированных гаплотипов, и делится на константу скорости мутации, как тоже было показано выше.

Очень важно понять, что если линейный и логарифмический методы дают разные времена до общих предков, то выборка «кривая», то есть неоднородная, и происходит от нескольких общих предков, как минимум от двух. Получаемые времена до общих предков тогда лишены определенного смысла, предок «фантомный».

Приведем пример. Имеем неоднородную выборку из 300 гаплотипов в 25-маркерном формате, в которой 200 гаплотипов происходят от общего предка, который жил 3000 лет назад, и 100 гаплотипов – от предка, который жил 800 лет назад. Если мы построим дерево гаплотипов, то сразу увидим, что 200 гаплотипов образуют одну большую и глубокую (высокую) ветвь, и 100 гаплотипов – плоскую ветвь. Тогда сразу можно разделить ветви, и каждую из двух ветвей обсчитывать отдельно. В первой ветви из 200 гаплотипов все 25-маркерные гаплотипы будут разными (то есть логарифмический метод с ними работать не будет), что уже покажет, что общий предок жил более 2500 лет назад (при 2500 годах в выборке могли бы быть два одинаковых гаплотипа, потому что [ln(200/2)]/0.046 = 100 условных поколений, или 2500 лет до общего предка). На все 200 гаплотипов будет 1104 мутаций от базового гаплотипа, что даст 1104/200/0.046 = 120 условных поколений, или 120х25 = 3000 лет до общего предка (вкладом возвратных мутаций здесь для простоты пренебрегаем).

Во второй ветви из 100 гаплотипов в 25-маркерном формате 23 гаплотипа будут идентичными друг другу. Это даст [ln(100/23)]/0.046 = 32 условных поколений, то есть 800 лет до общего предка. Иначе говоря, если смешать эти 200 и 100 гаплотипов, то в этой смеси 23 гаплотипа будут одинаковыми (из молодой ветви), и мы получим [ln(зоо/2э)]/о.046 = 56 условных поколений, то есть якобы 1400 лет до общего предка якобы одного для всех 300 гаплотипов. А мутаций во всей составной, неоднородной выборке будет 1251, если базовые гаплотипы обеих ветвей случайно совпадут. Тогда линейный метод даст 1251/300/0.046 = 91 условное поколение, или 2275 лет до якобы общего (фантомного) общего предка. Если базовые гаплотипы обеих ветвей будут разными, то время до фантомного общего предка будет практически любым между 3000 и 800 лет.

Итак, подводим итоги. Выборка составная, неоднородная, общие предки жили 3000 и 800 лет назад. Линейный метод дал фантомного общего предка 2275 лет назад, логарифмический -1400 лет назад. То, что эти времена не совпали друг с другом, говорит о том, что так считать нельзя, и выборки надо разделять. Обычно разделение проводится с использованием деревьев гаплотипов (см. следующий раздел).

Вопрос 40: Выборки в ДНК-генеалогии обычно несоизмеримо малые по сравнению с реальными величинами самих популяций. Как таким выборкам можно доверять? Есть «мнения», что выборки должны иметь как минимум 10 тысяч гаплотипов, чтобы получать относительно разумные данные.

Это совершенно ненаучная постановка вопроса, опять «по понятиям», по «мнениям», ни на чем не основанным. На это можно задать встречный вопрос, который уже был задан выше в настоящей книге – чтобы понять, что море соленое, нужно ли пробовать воду из всех бухточек? А как же химики делают анализ растворов, беря пробу всего лишь в долю миллилитра из ведра, цистерны, озера? Когда делают анализ крови, что, всю кровь из вас выкачивают? Нет. Значит, вопрос о размере пробы поставлен некорректно. Вопрос на самом деле сводится не к каким-то с потолка взятым числам, а к к тому, равномерно ли перемешана система, чтобы по малой пробе, или выборке, судить о всей системе. Этот вопрос в ДНК-генеалогии давно проработан, и результаты сопоставительных исследований показаны, например, в следующей таблице:

Таблица. История определений времени до общего предка гаплогруппы R1a на «пост-советском пространстве» по разным сериям гаплотипов.[52]


Из таблицы видно, что при последовательном переходе от серии из 26 гаплотипов до 2000 гаплотипов, и при увеличении числа мутаций в них в двести с лишним раз расчетное время до общего предка этих гаплотипов, в данном случае проживавшего на Русской равнине около пяти тысяч лет назад, получается практически одинаковым, в пределах погрешности расчетов. Это значит, что гаплотипы гаплогруппы R1a на пост-советском пространстве перемешаны достаточно хорошо, и все выборки вполне репрезентативны.

Конечно, могут быть и другие ситуации. Например, в горах в каждой долине состав гаплотипов (и гаплогрупп/субкладов) может заметно различаться, в отличие от того, что может наблюдаться на равнине, где гаплотипы более перемешаны за тысячелетия. Но в любом случае расчеты и выводы по гаплотипам относятся только к той конкретной выборке, которая рассматривалась, и только сопоставление разных выборок может показать, насколько система «перемешана», и решить вопрос об обобщении результатов расчетов и выводов на всю популяцию региона, или только ее конкретную часть. Но пока репрезентативность разных выборок наблюдается и в горах. Например, разные выборки осетин и карачаево-балкарцев дают воспроизводимые результаты для каждого из этих этносов. Перемешивание между ними обнаружено, но очень незначительное, практически не влияющее на результаты расчетов.

В большинстве случаев результаты расчетов почти не зависят от размера выборки (при числе гаплотипов больше двух-трех десятков), то есть они устойчивы к статистическим вариациям, если популяция достаточно перемешана и выборка произведена неупорядочено. Размер выборки увеличивает точность, и то только до определенных пределов. Это, повторяем, относится к довольно большим популяциям, которые перемешались за тысячелетия, но именно с такими обычно и работают.

Вопрос 41: Что такое «деревья гаплотипов» в ДНК-генеалогии?

По ходу изложения мы будем показывать деревья гаплотипов, которые отражают ДНК-картину этносов, родов, племен. Это вовсе не значит, что гаплотипы определяют этнос. Но они его в определенной степени описывают, каждый этнос по-разному. Человеку непривычному эти деревья представляются некими абстрактными образованиями, но в них на самом деле заключен большой смысл и в их графическом виде дается большой объем информации. Для того чтобы сделать деревья в этой книге более понятными и осмысленными, приведем несколько вводных, «модельных» примеров.


Рис. 7. Дерево, состоящее из 68 гаплотипов гаплогруппы R1a в их 6-маркерном формате. Базовый гаплотип здесь 13 25 15 11 12 11 (в системе DYS 393, 390, 19, 391, 388, 392). Базовые гаплотипы образуют «гребенку» на дереве.

На рисунке выше приведено дерево реальной выборки из 68 гаплотипов гаплогруппы R1a. Гаплотипы простенькие, 6-маркерные, общий предок всех жил всего 625 лет назад, так что мутаций в гаплотипах набежало мало. Можно даже заранее посчитать, сколько. Это дерево гаплотипов потомков Джона, Лорда Британских островов, который жил в 14-м веке и умер в 1386 году. Его потомки – известный шотландский клан Мак-Доналдов (один из Мак-Доналдов был маршалом у Наполеона). Константа скорости мутации для 6-маркерных гаплотипов равна 0.0074 мутаций на гаплотип на условное поколение в 25 лет. Тогда за 625 лет (25 условных поколений) в каждом гаплотипе набежит 0.0074х25 = 0.185 мутаций, и на все 68 гаплотипов будет 0.185х68 = 13±4 мутаций. Погрешность рассчитывается по обычным правилам математической статистики.

Смотрим на дерево гаплотипов. Там – 15 мутаций, то есть в пределах погрешности. Можно посчитать самим, это все «вылезающие» из колеса спицы. А вылезают они в разных (и заранее непредсказуемых) местах, потому что мутации происходят неупорядоченно. 53 гаплотипа не мутированы, они образуют ровную гребенку, или «колесо» вокруг центральной части. Это – тот же самый гаплотип, что имел общий предок всех 68 человек, то есть Джон, Лорд Островов:

13 25 15 11 12 11

53 человека этот гаплотип полностью сохранили, потому что 625 лет – это относительно малое время, и 15 мутаций – это все отклонения от предкового гаплотипа, что за это время смогли произойти.

Показанные выше шесть чисел соответствуют шести участкам в Y-хромосоме ДНК, в которых повторяются выбранные исследователями короткие нуклеотидные последовательности. В первом участке – 13 повторов, во втором – 25 повторов, в третьем – 15 повторов и т. д. Мутация – это изменение числа повторов. Ошибся копирующий фермент при биологическом копировании Y-хромосомы, скопировал третий участок не 15 раз, как завещали предки, а 16 раз, получилось

13 25 16 11 12 11

Это – два идентичных гаплотипа, на дереве выше под номерами 054 и 060. С правой стороны – гаплотип 061, он имеет вид

14 25 15 11 12 11

У него мутация проскочила в первом участке, было 13 повторов, стало 14. То есть опять система копирования ошиблась в сторону завышения числа повторов. А вот в семерке идентичных гаплотипов под номерами 055–057, 062, 064, 066, 068 – мутация прошла во втором участке, на понижение (25 ? 24) и получилось

13 24 15 11 12 11

Действительно, этот участок, или маркер, как их называют, один из самых подверженных мутациям. Теория подсказывает, что в первом участке на все гаплотипы произойдет только одна мутация, во втором – семь мутаций, в третьем – две мутации. Так и получилось на практике. То есть даже при такой малой статистике закономерности в целом выполняются. Более того, все остальные пять мутаций на дереве гаплотипов относятся к тому же (второму) быстрому маркеру. Гаплотипы под номерами 059, 063 и 065 имеют вид

13 26 15 11 12 11

то есть мутация прошла на единицу на повышение, 25 ? 26. Последние две мутации, в гаплотипах под номерами 058 и 067, оказались двойными (25 ? 23, 25 ? 27):

13 23 15 11 12 11

13 27 15 11 12 11

Они и сидят по обе стороны «букета», потому что не происходят одна из другой. Заметьте, что длина «спицы» в двух последних случаях тоже двойная, по сравнению со всеми остальными. То есть по виду дерева гаплотипов можно сказать, какие мутации одиночные, какие – двойные или тройные.

Внешний вид «дерева» определяется настройками профессиональной компьютерной программы, которая строит его на основании вводимого списка гаплотипов. Она сортирует гаплотипы по ветвям, то есть по похожести гаплотипов, сортирует по тому, в каких маркерах произошли мутации, сколько мутаций произошло, и по тому, насколько ветви древние. Поэтому по виду дерева человек опытный сразу может понять, какова структура той или иной популяции, сколько в ней основных ветвей, каков относительный возраст ветвей, и далее по числу мутаций в ветвях рассчитать, когда жил общий предок каждой ветви. Таких компьютерных программ много, наиболее известная – PHYLIP, с преобразованием MEGA.

По виду базовых гаплотипов в разных регионах и по возрасту их ветвей можно устанавливать, откуда, куда и когда проходили древние миграции людей и где сейчас живут их потомки. То есть можно проводить ДНК-генеалогическое картирование регионов, материков, и всей планеты, как в пространстве, так и во времени. В этом – методология ДНК-генеалогии. А дальше идут интерпретации получаемых данных в терминах истории, языкознания, антропологии, стыковка их с известными данными (тогда это по сути «калибровка»), или с данными неустоявшимися, сомнительными, конфликтными – тогда это дополнительная «точка опоры», или, наконец, это введение в научный оборот совершенно новых данных, и открытие пути для их верификации, проверки, обсуждения, выдвижения новых гипотез и положений.

Следующие несколько вопросов с соответствующими ответами образуют своеобразный глоссарий, или словарь. Ряд понятий были уже рассмотрены ранее, но повторение – мать учения. Это вопросы-ответы помогут многим еще раз взвесить, насколько усвоен материал, и насколько могли быть пропущены некоторые детали.

<<< Назад
Вперед >>>

Генерация: 5.173. Запросов К БД/Cache: 3 / 1
Вверх Вниз