Здравствуйте друзья, меня зовут Александр Ракитько́, французская фамилия.
Я занимаюсь статистикой в компании Genotek. Genotek делает ДНК-тесты, самые разные, в том числе тесты на происхождение. И сегодня я поговорю про то, что наиболее, наверное, интересно в контексте сегодняшнего форума — это поиск родственников.
Чтобы начать говорить про поиск родственников, хотелось бы напомнить чуть-чуть школьной генетики. Кто помнит, сколько хромосом у человека? У здорового человека обычно есть 22 так называемые аутосомы: половые хромосомы и так называемая митохондриальная ДНК. Y-хромосома определяет пол человека. У мужчин она есть, у женщин её нет. Соответственно, она всегда передаётся только от отца сыну.
Митохондриальная ДНК всегда передаётся от матери детям. Анализируя мутации Y-хромосом и митохондриальной ДНК, мы имеем некоторую возможность отслеживать пути миграции по отцовской и материнской линиям. Об этом мы поговорим позже, а сейчас сфокусируемся на первых двадцати двух парах хромосом. На них много-много маркеров. Вообще весь геном — это три миллиарда букв в двух копиях. Обычные современные технологии исследуют порядка 500–600 тысяч маркеров на аутосомах. Это позволяет считать риски заболеваний, находить наследственные мутации, искать родственников и определять этнический состав.
Какая идея заложена в основании всех алгоритмов поиска родственников на основании ДНК-тестов? Предположим, два человека прошли ДНК-тесты, их геном расшифровали, в нём 600 000 точек. Они примерно равномерно разбросаны по всем хромосомам. Мы знаем, что половина хромосом досталась нам от мамы, половина досталась от папы. Вы, может быть, помните слово «кроссинговер» — это означает, что перед тем, как передать хромосомы ребёнку, у мамы, например, эти хромосомы как-то обмениваются сегментом.
Вот у нас была некоторая бабушка, у которой были коричневые и бежевые хромосомы. И она передала своему ребёнку какую-то их комбинацию. Затем эти комбинации идут дальше по её потомкам. В итоге оказывается, что среди раскраски хромосом ныне живущих двух людей можно найти общий сегмент. Так называемый IBD-сегмент, который достался им от общего предка.
Это на словах очень просто — нашли общие сегменты, измерили их длину, сколько их и предсказали, когда был общий предок. На деле всё гораздо сложнее, дальше начинается машинное обучение, статистика, всякая жуть.
Какой результат человек получает, когда он проходит ДНК-тест на поиск родственников? Он получает список родственников с указанием предполагаемой степени родства и возможность связаться с родственником.
Это, кстати, очень тонкий вопрос, который надо обсуждать: можно ли разрешать писать всем или человек должен сам решить, хочет ли он, чтобы ему написали, например, дети, о которых он не знает? Здесь пока что нет какого-то единого верного мнения. Мы придерживаемся политики, что каждый сам решает, хочет он участвовать в поиске родственников или нет.
Хороший вопрос, кстати, можно ли построить древо с помощью ДНК-тестов, анализируя геномы своих близких родственников? Можно. В качестве примера приведу дерево семьи, члены которой сдали ДНК-тест.
Вам это может показаться смешным, нарисовать дерево на два-три поколения вверх — это очень легко. Но надо понимать, что мы не имеем ни имён, ни фамилий. Даже даты рождения мы не имеем, только пол можем определить. И восстановить структуру дерева не так-то просто. Это было бы проще, если бы у нас никогда не было, например, неполнородных браков. Что значит «неполнородных»? Это когда у нас, например, у двух детей общий отец, но разные матери. Это сразу «взрывает» количество возможных генетических деревьев, и выбрать правильное становится уже сложно. Это другая, более сложная ситуация, когда у нас один папа и три разных мамы было.
Вопрос, который возникает дальше: а насколько далеко назад в поколениях я могу найти родственников? И, вообще, какая точность?
Можно проводить эксперименты, что мы активно делаем. Симулируем родословную и пытаться оценивать у них генетические сходства. И оказывается, что на малых степенях родства всё работает очень точно. Точность 98–99%. Как только мы переходим уже к троюродным-четвероюродным братьям, то начинаются всякие погрешности. Всё потому, что на самом деле общая ДНК, которая досталась им, её не так много. Однозначно сказать, в каком поколении был общий предок, сложно.
Поэтому обычно сообщают интервал, например, четвёртое-шестое поколение. Мы взяли какое-то количество тысяч наших клиентов, изобразили их точками, и точку соединили линией, если они являются родственником до 10-го поколения. У нас получилась такая картинка.
Что мы здесь видим? Мы видим клубок в самом центре и какие-то точки по краям, — это просто люди, у которых пока не нашлось ни одного родственника. 95% людей в этом кубке, в этом котле. Соответственно, каждая линия означает, что они родственники.
Генетическая генеалогия и этничность
Мы пошли дальше и решили украсить людей по их этничности, предсказанной по генетике. Этничность не определяется генетикой, но есть сильная сцепленность. Например, вот здесь получилась восточноазиатская семья китайцев, вот они друг другу родственники, они все оранжевые. Синие — это восточные европейцы, их подавляющее большинство среди наших клиентов.
Если всматриваться, то можно увидеть такой фиолетовый клубок в клубке. Как вы думаете, кто это? Правильно, это евреи. Как можно догадаться об этом? По статистике два случайных еврея-ашкенази имеют столько же общей ДНК, сколько имели бы пятиюродные братья европейцы. Это обусловлено тем, что 700 лет назад евреи прошли через так называемое «бутылочное горлышко». Их популяция с двадцати трёх тысяч сократилась в несколько раз. Есть примерно 350 человек, которые жили 700 лет назад и сейчас являются предками всех ныне живущих евреев-ашкенази, которых десять миллионов по всему миру.
Соответственно, у них генетическое разнообразие существенно меньше, чем в каких-то других более смешанных популяциях. Это не так хорошо, на самом деле. Потому что из-за отсутствия генетического разнообразия, из-за того, что большинство браков осуществляется между евреями-ашкенази, и отсутствуют межэтнические браки, у них есть наследственные заболевания, которые встречаются только среди евреев-ашкенази. Это такой насущный и важный вопрос, который генетика тоже старается решать.
Компании по генетической генеалогии
Вопрос: «Допустим, я сделал тест в какой-то из компаний. Могу ли я поискать родственников не только внутри этой компании, но и в каких-то базах?».
Нет такой базы родственников планеты Земля. У каждой компании своя база, но компания допускает возможность, чтобы вы могли, например, сдать тест в Genotek, выгрузить свои исходные данные, расшифрованный геном, загрузить в MyHeritage и поискать родственников там. Работает и обратная схема.
Теперь вернёмся как раз-таки к гаплогруппам, митохондриальной ДНК, Y-хромосоме. Этнический состав — это история, когда мы пытаемся окрасить ваш геном в этносы, ныне живущие на планете Земля, в геномы современных людей. Можно привести в пример результат конкретного человека.
Он оказался на 15% евреем, на 40% из восточной Европы и южного Кавказа. По всей видимости, от бабушки ему досталось 15% евреев. Это плюс-минус соответствует тому, что у него была чистокровная бабушка-еврейка. Как это работает, я готов обсуждать уже где-нибудь в кулуарах. Потому-что всё-таки это уход в сторону, так же как уход в сторону гаплогруппы. Мы, анализируя древние геномы и геномы современных людей, можем узнать, что мутации в Y-хромосомах и митохондриальной ДНК возникали примерно 7−12 тысяч лет назад в таком-то месте.
Проанализировав ваши мутации, мы можем отмотать всю историю назад на 140 тысяч лет. Тогда все наши предки жили в Африке и назывались Y-хромосомный Адам и митохондриальная Ева. Можем также давать какие-то разукраски по тому, где сейчас обитают люди с такими же группами, как ваша.
Анализ 650 тысяч маркеров весьма полный. Эти данные можно использовать не только для генеалогии, но и для других важных аспектов нашей жизни. Например, носительство наследственных заболеваний. Это история про то, когда есть два родителя, у них один из двух генов в геноме сломан. Они являются носителями мутации, которая относится к какому-то заболеванию, которое никак не проявляется. С вероятностью 25% в такой паре рождается больной ребёнок, потому что оба родителя случайно передали ему именно сломанный ген. Например, если возвращаться к евреям-ашкенази, 3% евреев ашкенази являются носителями болезни Тэя Сакса. Это заболевание нервной системы: ребёнок рождается, первые месяцы живёт как все, без каких-то симптомов, потом у него возникают проблемы с реакцией, его разбивает паралич, и он не доживает до пяти лет никогда.
Есть также риски мультифакторных заболеваний. Генетика делает существенный вклад в такие болезни, как онкологические заболевания, заболевания сердечно-сосудистой системы. Соответственно, этот вклад можно в некоторой мере оценивать. Если ещё сюда приплюсовывать образ жизни, то получается прямо такая хорошая прогностическая модель, которую можно использовать для того, чтобы выбирать те заболевания, которые стоит профилактировать. Профилактировать одновременно всё невозможно. Но если знать свои предрасположенности, то можно составлять check-up по себе и проходить именно его.
Что ещё даёт генетическая генеалогия?
Очень важный пункт — эффективность лекарств. Уже во многих лекарственных инструкциях прямо написано: перед тем как назначить дозу варфарина, нужно пройти генетическое тестирование. Перед тем как принимать определённые антидепрессанты, нужно выяснить, как они у вас усваиваются генетически, как работают ваши цитохромы — будут ли эти лекарства эффективны, будут ли они с правильной скоростью выводиться из организма.
Особенности организма. Здесь я подразумеваю усвояемость витаминов, непереносимость определённых продуктов (лактозы, кофеина). Они тоже обуславливаются генетикой. И такое новое перспективное направление — спортивная генетика, отбор в олимпийский сборной и так далее. Это пока что такие качели: одна статья выходит, говорит, что это всё работает, это классно, это надо уже внедрять; потом выходит статья, которая её опровергает и наоборот.
В завершение я хотел бы сказать о том, что, на мой взгляд, нам нужно. В генетике есть база данных с огромным количеством евреев-ашкенази. Почти вся Исландия отгенотипирована. Почти у всех жителей Исландии расшифрованы генетические паспорта! Эстония стремится к тому, чтобы оцифровать полностью своё население. В плане популяционной генетики Россия — это просто белое пятно, которое очень мало кто изучает. Научному сообществу доступны какие-то несчастные десятки геномов русских людей для анализа. Это печально, нужно восполнять. Мы стараемся это делать, мы не только занимаемся бизнесом. Мы занимаемся, в первую очередь, наукой и открыты к любым каким-то коллаборациям, в том числе и в плане генеалогии. Популяционная генетика, поиск родственников — это всё очень интересно.
Генетика — это не самостоятельная наука, она всегда идёт в паре с кем-то. Если мы говорим про этнический состав, про поиск родственников, генетика идёт за руку с генеалогией и генеалогами. Потому что нужны данные о том, кто эти люди, где они жили, какого они происхождения. Про болезни то же самое — нам нужно описание от медиков, например, какими болезнями эти люди болеют. Консорциум — это классная штука, и по здоровью они уже появляются. Мы вошли в консорциум по психиатрической генетике, по генетике психиатрических заболеваний. По генеалогии я такого консорциума не знаю. Возможно, он есть, но я искал и не нашёл.
Это сильно упрощает взаимодействие, когда можно прийти, сесть за круглый стол и обсудить вопросы генетики и генеалогии с разными специалистами. И мы очень долго пытаемся найти человека, который мог бы проконсультировать клиента по результатам: рассказать, что такое гаплогруппа, как понимать процент в этническом составе и объяснить, почему у него столько родственников. Таких людей пока что не нашлось, это тоже проблема, и я считаю, что надо таких экспертов готовить.