Все компании, предлагающие ДНК-тесты для генеалогических исследований, также предоставляют своим клиентам их так называемые «сырые» данные ДНК (DNA raw data). В зависимости от интересов и знаний, эти данные можно использовать и для других целей, например, для получения дополнительной информации о своих генетических предрасположенностях. Для этого вы можете воспользоваться сервисами третьих лиц, но с помощью «сырых» данных вы и сами можете «покопаться» в своей ДНК.
В этих «сырых» данных ДНК указаны около 700 000 снипов (SNPs), которые являются вариациями четырех нуклеотидных оснований (А, T, G, C), отличающих одного человека от другого. Какие именно снипы, а также их протестированное число, могут слегка отличатся от одной компании к другой, но в целом это не влияет на сравнение родственников между собой, которые делали ДНК тесты в разных компаниях (кроме только совсем дальних родственников).
Вот так выглядит первая страничка моих «сырых» данных ДНК, предоставленных мне компанией 23andme:
Снипы обычно начинаются с «rs«, после чего следуют цифры. В 23andme некоторые снипы имеют другое название начинающиеся с «i«. Затем указываются хромосома и точная позиция, а в конце также ваши аллели этого снипа, которые достались вам от ваших родителей. (Какой из них вы получили от матери, а какой от отца, можно узнать сравнивая их файл с вашим. В некоторых случаях это можно узнать и через других родственников, как в моем примере позже.) Иногда вместо «А», «Т», «С» или «G» вы увидите «D» и «I» — «D» обозначает в этом случае делецию, а «I» нормальный вариант. (Кстати, ваш ДНК-файл лучше не отпечатывать! Поверьте, пандемия коронавируса закончится гораздо раньше, чем ваш принтер выкинет последний листок ?)
Снипы могут быть связаны с определенными свойствами. На страничке SNPedia на данный момент внесены 110877 снипов, где наряду с объяснениями, вы также найдете ссылки на различные научные исследования.
Одним из самых популярных и наиболее лучше исследованных снипов является rs333, который показывает, устойчивы ли вы к вирусу ВИЧ-1 или нет. Это связано с мутацией, а конкретнее, с делецией 32 пар оснований третьей хромосомы на позиции 46414947. При заражении клетки вирусу ВИЧ-1 необходимы рецепторы, в том числе и CCR5. Но благодаря мутации CCR5-Δ32 этот рецептор настолько изменен, что вирус больше не может присоединится к клетке, из-за чего и проявляется устойчивость1.
Примерно у 1% населения мира (чаще всего в северных странах Европы2) эта мутация встречается в гомозиготном состоянии (на обеих хромосомах, то есть была унаследована от обоих родителей), а у около в 10% гетерозиготном состоянии (от одного родителя). Последние могут заразиться вирусом, но все равно имеют частичную устойчивость, которая проявляется в виде меньшего количества вируса в организме и значительно замедленного течения болезни1. По расчетам ученых мутация произошла в одном человеке (single mutation event2), который жил от 700 до 2000 лет назад3, так что все люди с этой мутацией являются потомками этого первого человека. Поскольку ВИЧ/СПИД является современным заболеванием, ученые предполагают, что мутация CCR5-Δ32 уже и раньше должна была представлять собой преимущество против других вирусных инфекций, скорее всего оспы4. Считается вероятным, что никто иные как викинги5 распространили эту мутацию по Европе и России.
Вы просто не можете себе представить, как я была удивлена, обнаружив такую редкую и особую мутацию у одной из моих тетей, родной сестры моего отца!
Так как мы знаем где именно на третьей хромосоме расположен снип rs333, мы можем поискать его варианты «D» или «I» в наших сырых данных. А если Вы делали ДНК тест в компании 23andme, то тогда еще проще: зайдите в личный кабинет на страничке и выберите «Browse raw data«. Нужно только знать, что у них этот снип называется «i3003626», а вместо «D» или «I» вы увидите либо минус, либо последовательность из 32 нуклеотидных оснований.
В следующем видео вы увидите сначала мой профиль с двумя нормальными вариантами, а затем профиль моей тети с мутацией и одним нормальным вариантом:
(Если видео не показывает, попробуйте еще раз на ссылку нажать.)
Трое из братьев и сестер моего отца (и он сам) сделали тест ДНК, но эту мутацию я нашла только у тети Г. Поскольку все остальные ее не унаследовали, это означает, что у моего дедушки или бабушки по отцовской линии, мутация тоже должна была быть только на одной хромосоме. Очень надеюсь, что будущем получится протестировать еще и других двух братьев моего отца и проверить их результаты на мутацию CCR5-Δ32.
Сначала я не могла сказать, от кого моей тете передалась эта мутация — от моей бабушки или от моего дедушки? Но мое любопытство уже проснулось, и мне стало интересно, смогу ли я узнать что-то новое, сравнив результаты еще и с другими родственниками? Таким способом у меня на самом деле получилось узнать, что мой дедушка Александр Стрельников оказался носителем мутации и тем, кто передал ее моей тете!
Для этого мне сначала нужно показать вам сравнение протестированных братьев и сестер Стрельниковых между собой. Позиция делеции CCR5-Δ32 указана на картинке около 46 Мб (46414947). Сама картинка представляет собой приложение one-to-one comparison из GEDmatch, загруженное в таблицу эксель Стивена Фокса для визуального фазирования.
Приложение one-to-one comparison в GEDmatch
Для тех, кто незнаком с GEDmatch: с помощью приложения one-to-one comparison сравниваются обе хромосомы одного человека с обеими хромосомами другого человека. Если сравнивать братьев и сестер между собой, то таким способом можно разделить их сегменты ДНК на четырех человек, то есть на обеих бабушек и обоих дедушек (этот метод называется Visual Phasing).
Если совпадение указано зеленым цветом, это означает, что на этой позиции оба брата или сестры на обеих хромосомах унаследовали ДНК от одних и тех же бабушек или дедушек (fully identical region = полностью идентичное совпадение).
Если совпадение указано желтым цветом, это означает, что на этой позиции оба брата или сестры только на одной из хромосом унаследовали ДНК от одной и той же бабушки или одного и того же дедушки (half identical region = полуидентичное совпадение).
Если красным цветом, это означает, что на этой позиции оба брата или сестры на обеих хромосомах унаследовали ДНК от разных бабушек или дедушек (non identical region = нет совпадений).
(Нижние синие полоски означают, что ДНК сегменты длинее 7 сМ = сантиМорганов.)
Вот здесь вы видите очень простой пример наследия:
А в приложении one-to-one comparison совпадения у детей этого фиктивного примера указывались бы вот так:
Сравнение Стрельниковых братьев и сестер между собой
Сравнение тети Г. с тетей Л.(L & G) показало, что у них на позиции около 46 Мб есть полуидентичный сегмент ДНК. То есть, на одной из своих двух хромосом на этой позиции, обе унаследовали ДНК от одной и той же бабушки или одного и того же дедушки. Поскольку у тети Л. мутации нет, эта бабушка или дедушка не могли ее передать. На следующей картинке эта бабушка или дедушка теперь будет сочетаться со светло-коричневым цветом, а ДНК бабушки или дедушки на их других хромосомах будет сочетаться с двумя разными цветами:
Три цвета из четырех мы таким образом уже определили.
У тети Г. с дядей П. (G & P) здесь также имеется общий полуидентичный сегмент. Так как у дяди П. и другой тети (L & P) на этой позиции полностью идентичные сегменты, то это и должен быть тот самый светло-коричневый сегмент у всех трех.
У тети Г. и моего отца (G & D) (Dad = папа) около 46 Мб совсем нет совпадений, то есть ДНК на обеих хромосомах была унаследована от разных бабушек и дедушек. Поэтому и цвета на этом месте у них будут тоже разными:
Теперь сравниваем их всех с В., их двоюродной сестрой по отцовской линии. (Сравнение с А., другим двоюродным братом по отцовской линии, привело к тому же результату.)
У В. со всеми кроме тети Г. имеется общий полуидентичный сегмент от 30 Мб до 107 Мб (отмечен зеленым цветом на другой картинке), который они все получили от того же дедушки или той же бабушки по отцовской линии. Это означает, что полуидентичный (светло-коричневый) сегмент ДНК, который тетя Г. разделяет с тетей Л. и дядей П. должен быть на ее хромосоме полученной от матери. А это означает, что сегмент ДНК с мутацией должен быть на ее хромосоме полученной от отца!
На данный момент я не могу сказать, от кого из своих родителей мой дедушка по отцовской линии унаследовал эту мутацию и была ли она у этого родителя в гомоциготном состоянии или нет. Но мне очень интересно будет это узнать, особенно потому, что мама моего дедушки, моя прабабушка Домна Пимшина была из коренных жителей Сибири, а мутация CCR5-Δ32 часто распространена у мордвинов2 и поморов6, двух коренных народов России (хотя статус последних остается спорным на данный момент). Никто пока не мог мне сказать из каких именно коренных жителей моя прабабушка происходила. А вдруг эта мутация окажется подсказкой? Так как к церковному приходу по месту жительства моих прабабушки и прадедушки относились 128 старообрядцев поморского согласия!
О мутации можно прочитать еще здесь:
Ссылки:
1. https://genetics.thetech.org/original_news/news13
2. https://pubmed.ncbi.nlm.nih.gov/9466996/
3. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1377146/pdf/9585595.pdf
4. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC299980/
5. https://www.ncbi.nlm.nih.gov/pubmed/14636691
6. http://www.dna-technology.ru/files/images/d/0b136b567d25d4be1dfa26a8b39ec2b9.pdf
7. https://en.wikipedia.org/wiki/CCR5
Views: 605