Klyosov1
"Заметки" "Старина" Архивы Авторы Темы Гостевая Форумы Киоск Ссылки Начало
©"Заметки по еврейской истории"
Сентябрь  2007 года

Анатолий Клёсов

 

Ответ с признательностью

на

 

Математические размышления об исследовании А. А. Клёсова по еврейской ДНК-генеалогии (Геннадий Любезник)

 

 

Автору всегда приятно, когда его произведения находят отклик у читателей. Приятно вдвойне, когда читатель выступает с конструктивными замечаниями и предложениями. Приятно втройне, когда этот читательспециалист в своей области. И приятность стремится к бесконечности, когда замечания и предложения даются в благожелательном ключе.  

В «математических размышлениях» Г. Любезника есть, на мой взгляд, три части. Первая – сомнительная, вторая – познавательная, третья – творческая.  

И это хорошо. Есть в этом определенная законченность.  

ЧАСТЬ ПЕРВАЯ.

СОМНИТЕЛЬНАЯ

Она – о том, что обоснование выбора критерия пяти мутаций в моей статье является математически ошибочным, и приводит к любому времени жизни еврейских патриархов – от нуля до 3600 лет назад.  

Это, конечно, не так. Точнее, как математическую игру без оглядки на реальность можно при желании и к такому результате привести, но только при полном отсутствии тормозов.   

Разберемся.  

Дело в том, что обоснование пяти мутаций «в сторону» делалось на основе того, что время, прошедшее от общего предка для 12 колен израилевых, равно примерно 3600 лет. Эта цифра появилась не зря и не с потолка. С ней получалось, что частота мутаций в гаплотипах примерно равна 0.002 на маркер на поколение, что и соответствовало известным частотам мутаций, определенных в прямых экспериментах на парах отец-сын. Поэтому эти 3600 лет и были выбраны для «калибровки» предельного числа мутаций для расчетов, с целью последующего применения именно для поиска «гаплотипа 12 колен» по странам и континентам.  

Логика выбора этих 3600 лет была следующей. Если посмотреть на весь список из 399 евреев, опубликованный в научной статье, процитированной моим славным оппонентом, то видно, что один гаплотип повторяется 92 раза, и является самым частым в выборке. Такой гаплотип я называю базовым. Другие его называют модальным или предковым. Вокруг этого гаплотипа – облако других гаплотипов с мутациями базового, а именно с одной мутацией, двумя, тремя, четырьмя... С пятью мутацией оставалось уже только пять гаплотипов, с шестью – ни одного, с семью мутациями был один.           

Из этого я сделал вполне разумный вывод, что пять мутаций вполне исчерпывают это «облако гаплотипов», по крайней мере вглубь веков до общего предка всех этих евреев с базовым гаплотипом 14-16-23-10-11-12. Библия его называет Иаковом, но кто Библии не доверяет – пусть называет хоть Васей Пупкиным. В таком случае этот Вася Пупкин безвариантно имел базовый гаплотип 14-16-23-10-11-12, и был общим предком всех этих 200 евреев. Осталось выяснить, когда он жил и творил.  

Так вот, у этих 200 евреев-гаплотипов в пределах пяти мутаций оказалось суммарно 270 мутаций. Как читатель видит, никакой религии пока здесь не присутствует, никаких изначальных дат не закладывается. Просто 200 евреев с их мутациями – вот и вся «источниковая база». 

Итак, 270 мутаций на 200 гаплотипов, то есть 1.35 мутаций в среднем на гаплотип. А поскольку в каждом гаплотипе по шесть маркеров – то в среднем по 0.225 мутации на маркер. А мы знаем из прямых опытов по парам отец-сын, которые описаны в моем рассказе, что при переходе от отца к сыну в среднем происходит по 0.002 мутации на маркер на поколение. Это, правда, определялось в среднем по 17 маркерам, а у нас только шесть маркеров, но лучшего у нас нет. Тем более что частота мутации 0.002 на маркер на поколение в общем принята в научной литературе. С оговорками, что это приблизительно. 

Так вот, если 0.002 на маркер на поколение, а у нас 0.225 мутаций на неизвестное число поколений, то деля одно на другое получаем, что общий предок тех 200 евреев жил 0.225/0.002 = 113 поколений. На самом деле выходит 112.5, но не будем мелочиться. 113 поколений по 30 лет на поколение – примерно 3400 лет.  

Смотрим в данные по толкованиям Торы, которые нам любезно прислали знающие люди из Израиля, и видим годы рождения сыновей Исаака с 3575 лет до нашего времени (Рувим) до 3560 лет (Вениамин). Сходимость лучше, чем можно было ожидать.

Поскольку исходная публикация была почти полгода назад, что примерно соответствует каменному веку в моей системе координат по ДНК-генеалогии, то приведу пример откорректированного с тех пор расчета. Исправленная, откорректированная по большому массиву данных скорость мутации равна 0.0016 на маркер (в 6-маркерном гаплотипе) на поколение, при 25 годах на поколение. 270 мутаций в 1200 маркерах (200 гаплотипов) дадут 270/1200/0.0016 = 141 поколение, или 3525 лет до общего предка современных евреев с гаплогруппой J1.

Но в рассказе про гаплотипы 12 колен я взял для простоты круглую цифру в 3600 лет, к которой пришел более-менее консенсус при публичном обсуждении на данном сайте. Хорошая цифра. Есть в ней какая-то энергетика. И с прямыми экспериментальными данными хорошо согласуется.   

Итак, 3600 лет, 120 поколений по 30 лет в среднем на каждое.  

И что-то мне подсказывает, что лучше этого предка назвать Иаковом, чем Васей Пупкиным. Как-то гармоничнее получается. И исходя из этой гармонии я, не мудрствуя лукаво, назвал базовый гаплотип современных «ближневосточных» (по генеалогии) евреев «гаплотипом 12 колен», или ГДК, а самих евреев назвал «потомками 12 колен израилевых». У меня ощущение, что что-то такое я уже слышал. Но готов понести ответственность.  

Как показал мой славный оппонент Г. Любезник, если вообще не обращать внимание на предельное количество мутаций «в сторону», а просто ограничиться одной «еврейской» гаплогруппой (J1), то в нее попадут 194 человека из выборки, и получится та же цифра примерно в 3600 лет до общего предка

Иначе говоря, если брать просто гаплотипы в гаплогруппе J1, без всяких «лимитов» на число гаплотипов, то в списке окажется не 200 человек, а 194, и не 270 мутаций на всех, а 263. Это даст 263/1164/0.0016 = 141 поколение, или те же 3525 лет до общего предка. Разница, как видит читатель, несущественна. Точнее, ее просто нет

Да её и не могло быть, потому что, как помнит читатель, практически все ГДК  были выбраны с критерием пяти мутаций. Там ничего больше и не оставалось.  

Так что брать пять мутаций в сторону, или считать в пределах одной гаплогруппыразницы в данном случае нет. К главному выводу это никак не относится.  

Теперь про математическое обоснование пяти мутаций, на что обратил внимание мой славный оппонент. Он, будучи математиком, не обратил внимание на другую логику подхода. А логика была в том, что это обоснование было специально «заточено» под ГДК. С его, ГДК, 3600 лет от общего предка. Потому что в дальнейшем я собирался искать именно ГДК по всему миру. И мне нужен был критерий именно под ГДК. Поэтому вопрос стоял так – есть 3600 лет до общего предка, 120 поколений по 30 лет каждое. Действительно ли пять мутаций в сторону В ЭТОМ СЛУЧАЕ выбирают практически все гаплотипы? Ответ был – да, практически все. 99% от всех. Если от общего предка – 3600 лет.     

И я потом так и брал пять мутаций по всем остальным народностями арабам, и киргизам, и цыганам, и индусам, и славянам, и Лемба, и те же пять мутаций. Тем более, как мой оппонент уже заметил, при переходе к гаплогруппе с её 194 гаплотипами добавляется всего один гаплотипс семью мутациями (за пределами пяти мутаций). Что ровным счетом ничего не меняет. Доля процента. Так что пять мутацийхороший предел.                

Вопрос а зачем мне нужно было вообще брать пять или сколько там мутаций в сторону? Вот и славный оппонент говоритнужно брать одну гаплогруппу, и все дела. И даже пишет – «Устранение проблем: научные аспекты», «ценность нашей выборки» (по гаплогруппеАК).

Раскрою небольшой секрет: так все и считают. Именно по гаплогруппе. Так считаю и я. Одна бедагаплогруппы в работах часто не приводят. Самая большая база данных по ДНК-генеалогии гаплогрупп вообще не приводит. А там – 52 тысячи гаплотипов. И все без гаплогрупп. Как жить? И как считатьнеизвестно. Нужен какой-то другой критерий. И дальше, когда я считал гаплотипы Лемба, и йеменцев, и арабов, и эфиопов, и самаритян, и киргизов, и славян, и всех остальныхне было в списках гаплогрупп. Одни голые гаплотипы. И зная, что после евреев-ашкенази и сефардов мне придется к тем, другим переходить, я и затеял этот счет по пяти мутациям в сторону. Решил гаплогруппы проигнорировать, как будто их и нет. Провести эксперимент на себе. Как Пастер. И взять пять мутаций в сторону как лимит, иначе можно от евреев к арабам запросто попасть. Даже к палестинским. И нет чтобы просто взять, а решил на беду свою математически обосновать, что именно пять. Заложил в качестве предела 3600 лет, пять и получилось. Математически. 

Ну а дальше мой славный оппонент начинает фантазировать. Что, мол, если только две мутации в сторону взять, то до предка евреев получится всего 1200 лет. Но тут почти как в старом анекдотевзять-то он взять, но кто ж ему дать? Кто в здравом уме и в полном сознании будет брать всего две мутации в сторону при счете общего предка?? Это ж по живым гаплотипам резать!  По ГДК!

А то и по самому общему предку.

Но математикам всё прощается. Они ведьв хорошем смыслене от мира сего.

Поэтому и продолжает с азартом мой славный оппонент –  «весьма неожиданный факт состоит в том, что тот же метод, которым А.А. Клёсов подтвердил 3600 лет, подтверждает ЛЮБУЮ дату жизни Яакова, от 0 до 3600 лет назад

Здесь можно, конечно, поставить много смайликов. Со ртом до ушей. Потому что, если азарт чуть притушить, то придется написать – «это, конечно, если автор метода окончательно рехнулся, и ограничивает гаплотипы по какой-то странной причине нулем мутаций, одной, двумя, тремя, четырьмя, и вообще чем только ему в голову взбредет, не глядя на эти самые гаплотипы». 

И все эти слова только потому, что я, автор, решил математически проверить те самые пять мутаций в сторону, которые я и так использовал без всяких этих хлопот, и без всякой проверки. Воистину, с математикой без нужды свяжешьсясебе только на голову.    

Оргвывод после этой части. Счет внутри гаплогруппыобычное дело. Никакого открытия здесь нет. Но часто гаплогруппы не приводятся. И вот здесь я создал приблизительный подход, который позволяет из этой ситуации выйти. Подход отработал на ГДК, и применил на всех остальных народностях. Никакой религии там нет. Пять шагов просто позволяет примерно отделить гаплотипы одной гаплогруппы, а именно ГДК, от другой. Или отделить гаплотипы других гаплогрупп с ожидаемым возрастом предка между 3000 и 4000 лет.      

С этим разобрались.  

Поехали дальше.        

ЧАСТЬ ВТОРАЯ.

ПОЗНАВАТЕЛЬНАЯ 

Она – про единственного потомка царя Давида. Про Бустеная, он же реш галуса, он же «глава изгнания».  

Очень интересно. К нему мы еще вернемся.  

ЧАСТЬ ТРЕТЬЯ.

ТВОРЧЕСКАЯ 

Мой славный оппонент разделил евреев на три группы (точнее, они про опросах так сами оригинально подразделились) – коэнов, левитов и израэлитов, и предложил, что у каждой группы своя генеалогия, и свой общий предок. Не Иаков, а разные, в более близком прошлом, у каждой группы свой предок. Остальные предки не выжили. Не прошли бутылочное горлышко популяции. Смёл их генетический дрейф.

Теоретически не исключено. Но практическисильно сомнительно. Если нить с Иаковом прервалась, то как же его гаплотипбазовый», или «предковый», или «корневой») продолжается? Тут уж или-или. Или предок со своим гаплотипом есть, или его нет, и базовый гаплотип другой.

Давайте посмотрим. Линия коэнов, 118 человек, 71 базовый гаплотип, второй за ним по численности – 20 гаплотипов. Так что все в порядке, гаплотип 14-16-23-10-11-12 – базовый. Линия израэлитов, 60 человек, 17 базовых гаплотипов, второй за ним по численности – 14 гаплотипов. Пропорция другая, но формальнотот же базовый гаплотип. Так что предок у ниходин и тот же. По БиблииИаковно даже кому Библия не подходит как источниковый документвсе равно один и тот же предок, как его ни называть. Линия левитовно их всего 16 человек, это не статистика. Там того же гаплотипа всего три штуки, еще два других  вида - шесть и пять гаплотипов. Но не очень серьезно по таким данным вести счет.

Поэтому как версию гипотезу славного оппонента принять можно, но нужны более массивные данные для ее проверки. А вот если все линии сложитьи статистика уже лучше, 200 человек, и снижение от базового гаплотипа более плавное, как и должно быть за счет внутренней компенсации ошибок, и дата получается для всех 3500-3600 лет.

Поэтому вопрос пока открыт. Но идея хорошая.      

На самом деле мой оппонент, будучи человеком безусловно умным, подошел к известной проблеме ДНК-генеалогии, которая в общем виде решается плохо. А именно – когда выборка гаплотипов сильно несимметрична, и включает две (по меньшей мере) группы людей. Например, одна группа – потомки Иакова, но с общим предком 3600 лет назад, и их 80 человек. А другая группа – 120 чел, потомки некого плодовитого реш галуса, назовем его Бустенай, 1300 лет назад, и у него волей случая оказался тот самый базовый гаплотип, что и у Иакова. Всего в сумме 200 человек, 200 гаплотипов. Если бы у всех общий предок жил 3600 лет назад, базового гаплотипа было бы 24% от всех двухсот, или 48 гаплотипов. А при нашем варианте 24% базового гаплотипа окажется у потомков Иакова, а именно 19 базовых гаплотипов, и у 61% у потомков Бустеная, а именно 73 базовых гаплотипа. В сумме 92 базовых гаплотипа из 200. Ба! Да это именно то количество, что у наших 200 евреев и имеется! А мы на статистику грешили.  

Это, конечно, был рояль в кустах. Но он показывает, что и без всякого бутылочного горлышка, а просто имея недавнюю плодовитую генеалогическую ветку, можно смещать картину мутаций. Поэтому по правилам надо строить дерево гаплотипов, смотреть, насколько оно симметричное, или перекошенное, с боковыми ответвлениями, и только тогда считать. По частям.    

По нашей группе из 200 евреев так не делалось. Просто математический аппарат для этого еще не разработан.   

Приближаемся к заключению. Цитирую:  

"Хммм..." - возможно думает читатель - "Профессор химии говорит одно, а профессор математики другое. А если придет какой-нибудь профессор физики и скажет что-нибудь третье? Кому же верить?"

Да, действительно. Профессор математики говорит, что принятый метод обоснования выбора лимита пяти мутаций был некорректен, и профессор химии  соглашается, но говорит, что в общем некорректен, но для данной цели - вполне. Но оба согласились, что на результаты это не повлияло.

Как говорил хрестоматий Изя – «мне бы ваши заботы».

ЧАСТЬ ЧЕТВЕРТАЯ. ВНЕПЛАНОВАЯ.

ТИПА – НАТЕ, ПОЛУЧАЙТЕ

А вот пару-тройку (из многих) успешных примеров расчетов по мутациям гаплотипов могу привести. Недавно в сети были выложены гаплотипы членов знаменитого клана Мак-Доналдс, потомков Джона, Лорда Островов. Всего 64 гаплотипа, гаплогруппы R1a.

http://dna-project.clan-donald-usa.org/tables.htm

У них клан по разным гаплогруппам расходится, но годы жизни основателя приведены только для гаплогруппы R1a. Так вот, из этих 64 шестимаркерных гаплотипов 48 – базовых 

15-12-25-11-11-13 

и во всех 64 шестимаркерных гаплотипах есть 16 мутаций. Это на 64х6 = 384 маркеров.  

Число поколений до общего предка клана тогда равно 16/384/0.0016 = 26, то есть 650 лет до общего предка (принимая 25 лет на поколение).  Смотрим в данные кланаДжон, Лорд Островов, умер в 1386 году, 621 год назад. Через 29 лет после того, как стал общим предком, по нашим расчетам. Разумно. Такая точность даже чрезмерная и не нужна.

Берем 12-маркерные гаплотипы тех же 64 человек. В них – 39 базовых гаплотипов, и дополнительно 40 мутаций. Для 12-маркерных гаплотипов средняя частота мутаций 0.002 на маркер на поколение (там добавляются несколько быстрых маркеров, которые и сдвигают общую скорость мутаций) Считаем предка – 40/768/0/002 = 26 поколений. Те же 650 лет до общего предка. Ровно то же самое число.

А если по базовым гаплотипам посчитать? Просто как прикидка? С ними работает простая формула химической кинетики  

A/B = ekt 

где А = количество гаплотипов в списке, В = количество уцелевших базовых гаплотипов после  t поколений от общего предка, k =  частота мутаций на гаплотип, 0.0096 для 6-маркерного гаплотипа (0.0016 умноженное на 6). Проверяем, сколько из 64 гаплотипов должны остаться базовыми после 26 поколений от общего предка МакДональдсов.  

ln(A/B) = kt = 0.25   

Должно остаться 50 базовых гаплотипов из 64. А сколько осталось на самом деле? 48.  

Ну, знаете!   

А если по 12-маркерным гаплотипам? Здесь все также, только частота мутаций на 12-маркерный гаплотип 0.002х12 = 0.024 на гаплотип на поколение. Подставляем в формулу выше, и находим, сколько базовых гаплотипов должно остаться от 64 гаплотипов списочного состава.    

 ln(A/B) = kt = 0.624   

Должно остаться 34 базовых гаплотипа из 64. А сколько на самом деле? 39. Не так плохо. 

И пяти мутаций как предела не понадобилось. Так что метод работает на радость простым людям.

А если взять гаплотипы подревнее? Тех же МакДоналдсов, но гаплогруппы R1b. Самая большая подгруппа этой группы - потомки королевского дома Шотландии Dalriadic, куда входят и ирландские потомки. 6-10 век нашей эры. В группе – 35 гаплотипов, базовый гаплотип  

14-12-25-11-14-13,  

таких 24 в списке. В этих 35 гаплотипах – 13 мутаций от базового.  

Прикинем общего предка по доле базовых гаплотипов.  ln 35/24 = 0.377 = 0.0096t. 39 поколений от общего предка, то есть 975 лет. Неплохо. А по мутациям? 13/210/0.0016 = 39 поколений, 975 лет. Абсолютное совпадение.  

А по 12-маркерным гаплотипам?     

37 мутаций на 35 гаплотипов (420 маркеров). Считаем предка: 37/420/0.002 = 44 поколения, 1100 лет. 900-е годы. В аккурат въехали в искомое правление королевского дома Далриадов.  

Нужно еще древнее? Пожалуйста. Отдельная группа МакДоналдсов, неупорядоченная, нестроевая, приведена в составе 180 человек. Базовый 6-маркерный гаплотип  

14-12-24-11-13-13

 Вот данные, рассчитанные четырьмя способами – для 6-маркерных гаплотипов по доле базового гаплотипа (60 из 182) и по мутациям (187 мутаций), и для 12-маркерных гаплотипов по доле базового гаплотипа (14 из 181) и по мутациям (496 мутаций). Результаты, в этом порядке: 

116 поколений (2900 лет)
107 поколений (2700 лет)
107 поколений (2700 лет)
114 поколений (2900 лет).

Совпадение - поразительное. 2800 плюс-минус 100 лет.

И таких примеров можно приводить много. И все – без всяких пяти мутаций в  сторону.  

В заключениея искренне благодарен моему славному оппоненту, Геннадию Любезнику, математику и человеку, за хорошую рецензию. Наберем побольше гаплотипов еврееви проверим его гипотезу. Если Израиль подключится, а то они там гаплотипы не определяют. Арабы уже инициативу перехватывают, там генеалогию уважают. И ДНК-генеалогию тоже.   

Отдельное спасибо «Заметкам» и уважаемому Евгению Берковичу.  

 

Послесловие Геннадия Любезника

Одна из основных причин, по которым исследование А. А. Клёсова мне так интересно - это возможность на конкретном примере прочувствовать критерии истинности, применяемые в теории эволюции. Ведь ДНК-генеалогия - это, по сути, подобласть теории эволюции. У меня было смутное ощущение, что эти критерии отличаются от принятых в экспериментальных науках, но одно дело смутные ощущения, а совсем другое - знакомство с этими критериями на конкретном примере, который я сам подробно разобрал. Вот вывод, который я сделал в главе 5

...выводы ДНК-генеалогии, как и теории эволюции, справедливы только в том смысле, что пока никто не сделал более убедительных выводов из имеющихся данных. Это гораздо более скромный критерий истинности, чем в математике или в экспериментальных науках. И гарантии, что кто-то более находчивый не сделает более убедительный вывод из тех же данных быть не может. Не говоря уже о том, что "убедительность" - критерий весьма субъективный, одному кажется убедительным одно, а другому другое. 

И для меня нет ничего удивительного, что я и А. А. Клёсов не соглашаемся, какая интерпретация одного и того же набора еврейских гаплотипов более убедительна - его или моя. В этой области нет тaкого критерия, который позволил бы однозначно ответить на этот вопрос. 

Однако, мы оба согласны, что метод обоснования принципа "5 шагов в сторону" при образовании выборки был "математически некорректен". И опять ничего удивительного, что согласие достигнуто по математическому вопросу. В математике очень сильные критерии истинности, которые позволяют достичь согласия. 

Остальные спорные вопросы можно при желании обсудить в гостевой.

 

 


   


    
         
___Реклама___