Letzte Aktualisierung erfolgte am 04.05.2020. Zum besseren Verständnis wurden weitere Schaubilder hinzugefügt.
Alle Firmen, die DNA-Tests zur Ahnenforschungszwecken anbieten, stellen ihren Kunden auch ihre DNA-Rohdaten (DNA raw data) zur Verfügung. Je nach Interesse und Vorkenntnissen kann man diese Daten deshalb auch zu anderen Zwecken nutzen, z.B. um mehr über die eigenen genetischen Veranlagungen zu erfahren. Neben diversen Drittanbietern, bei denen man diese Daten gegen eine Gebühr analysieren lassen kann, hat man mit den Rohdaten auch selbst die Möglichkeit in seiner DNA „herumzustöbern“.
In der DNA-Rohdatei sind rund 700.000 SNPs aufgelistet, bei welchen es sich um Variationen der vier Nukleinbasen (A=Adenin, C=Cytosin, G=Guanin und T=Thymin) an einer bestimmten Position der DNA handelt und anhand welcher die Menschen voneinander unterschieden werden können. Die einzelnen SNPs als auch ihre genaue Anzahl können von Firma zu Firma geringfügig variieren. Da sie aber im Großen und Ganzen übereinstimmen, hat es keine Auswirkungen auf den Vergleich von Verwandten, die bei unterschiedlichen Anbietern getestet haben (von ganz entfernten Cousins und Cousinen mal abgesehen).
So sieht die erste Seite meiner 23andme-Rohdatei aus:
Jeder SNP wird eine ID mit „rs+Zahlenfolge“ zugeordnet, jedoch werden einzelne SNPs bei 23andme auch unter einer internen ID geführt, die man an einem „i“ am Anfang erkennen kann. Nach der ID sind das Chromosom und die Position der jeweiligen SNPs angegeben. Ganz rechts stehen noch die beiden Allele, die man von seinen Eltern an dieser Position bekommen hat. (Welches Allel von der Mutter und welches vom Vater stammt, erfährt man durch den Vergleich der eigenen Datei mit der Datei des jeweiligen Elternteils. In bestimmten Fällen kann man das auch indirekt über andere Verwandte herausfinden, wie später in meinem Beispiel.) Manchmal findet man anstatt „A“, „T“, „C“ oder „G“ auch ein „D“ und „I“ als Allel vor – „D“ steht dabei für eine Deletion an dieser Position der DNA und „I“ für die normale Variante. (Die DNA-Rohdatei sollte man übrigens nicht ausdrucken! Mit großer Wahrscheinlichkeit würde die Corona-Pandemie längst vorbei sein, bevor euer Drucker die letzte Seite ausspuckt 😉 )
SNPs können mit bestimmten Eigenschaften in Verbindung gebracht werden. Auf der Webseite SNPedia gibt es aktuell 110877 SNP-Einträge, die neben Erklärungen auch Verweise auf verschiedene Studien enthalten, die sich mit der jeweiligen SNP und ihren Auswirkungen beschäftigen.
Eine der populärsten und am besten erforschten SNPs ist rs333, an der man erkennen kann, ob man gegen das HIV Typ 1 Virus resistent ist oder nicht. Das hat mit einer Mutation in Form einer Deletion von 32 Basenpaaren auf der Position 46414947 auf Chromosom 3 zu tun. Das HIV Typ 1 Virus braucht den CCR5-Rezeptor, um in eine Zelle zu gelangen. Durch die CCR5 Delta32 Mutation wird dieser Rezeptor aber so verändert, dass das Virus nicht mehr in die Zelle eindringen kann und es zu einer Resistenz gegen das Virus kommt1.
Bei etwa 1% der Weltbevölkerung (am häufigsten soll diese Mutation in den nördlichen Ländern Europas vorkommen2) findet man diese CCR5 Delta32 Mutation auf beiden Chromosomenkopien und etwa 10% haben die Deletion nur von einem Elternteil bekommen. Letztere können sich zwar mit dem Virus infizieren, sollen jedoch eine partielle Resistenz aufweisen, die sich in Form einer geringeren Virusmenge im Körper und den deutlich verlangsamten Ablauf der Erkrankung äußert1. Die Mutation soll auf eine Person zurückgehen (single mutation event2), die vor 700-20003 Jahren lebte, sodass es sich bei allen heute lebenden Menschen mit der CCR5 Delta32 Mutation um Nachfahren dieser ersten Person handelt. Da es sich bei HIV/AIDS um eine neuzeitliche Erkrankung handelt, gehen die Wissenschaftler davon aus, dass die CCR5 Delta32 Mutation auch schon früher einen selektiven Vorteil dargestellt haben muss, z.B. gegen die heute ausgerotteten Pockenviren4. Es existiert eine Theorie, dass diese Mutation von den Wikingern5 in Europa und Russland verbreitet wurde.
Ich war jedenfalls sehr erstaunt, eine solch seltene und besondere Mutation bei einer Person aus meiner Familie vorzufinden!
Da die Position von rs333 auf Chromosom 3 bekannt ist, kann man in der DNA-Rohdatei nach dieser SNP suchen und nach einem „D“ als Allel Ausschau halten. Noch einfacher ist es bei 23andme, wenn man die Anwendung „Browse raw data“ auswählt. Hier muss man allerdings wissen, dass 23andme diese Mutation intern als „i3003626“ bezeichnet. Die Deletion wird dort als ein Minus angegeben, während bei der normalen Variante alle 32 Basen aufgelistet werden.
Es stellte sich heraus, dass eine meiner Tanten väterlicherseits diese Mutation auf einer Chromosomenkopie hat. Im folgenden Video seht ihr zuerst mein Profil mit den beiden normalen Varianten und danach das Profil meiner Tante mit der Deletion und einer normalen Variante:
(Falls das Video nicht abspielen sollte, bitte nochmal auf den Link klicken.)
Von den Geschwistern meines Vaters haben drei (und er selbst) einen DNA-Test für mich gemacht, jedoch habe ich nur bei Tante G. diese Mutation vorgefunden. Da die anderen drei Geschwister sie nicht geerbt haben, bedeutet das, dass auch bei meinem Großvater oder meiner Großmutter väterlicherseits die Deletion nur auf einer Chromosomenkopie vorgelegen haben muss. In Zukunft hoffe ich auch die letzten zwei Geschwister meines Vaters testen zu können, um auch ihre DNA-Ergebnisse auf diese Mutation zu überprüfen.
Wer von meinen beiden Großeltern väterlicherseits die CCR5 Delta32 Mutation an meine Tante weitervererbt hatte, konnte ich zunächst nicht sagen. Meine Neugier war jedoch geweckt und ich fragte mich, ob mir der Vergleich mit anderen Verwandten weitere Erkenntnisse liefern könnte. Am Ende konnte ich tatsächlich herausfinden, dass mein Großvater Alexander Strelnikov derjenige gewesen sein musste, der diese Mutation an meine Tante G. weitergegeben hatte!
Dazu muss ich euch zunächst den Vergleich der vier Strelnikov-Geschwister untereinander zeigen. Die Position der CCR5 Delta 32 Mutation ist im Schaubild bei etwa 46 Mb (46414947) angegeben. (Das Schaubild stellt die GEDmatch Anwendung One-to-one compare in der Excel-Datei für das Visual Phasing dar. Falls jemand dieses Schaubild nicht lesen kann, hier der Verweis auf einen Artikel für Einsteiger.)
Wenn ich Tante G. mit Tante L. vergleiche, sehe ich, dass die beiden ein halbidentisches DNA-Segment an der Stelle um 46 Mb teilen. Das bedeutet, dass die DNA der beiden hier von einem gleichen Großelternteil stammt. Da Tante L. die Mutation nicht hat, kann dieses Großelternteil sie nicht vererbt haben. Dieses Großelternteil ist im Schaubild mit hellbraun markiert, während den beiden anderen Großelternteilen unterschiedliche Farben zugeordnet wurden:
Wenn ich Tante G. mit Onkel P. vergleiche, sehe ich ebenfalls ein halbidentisches Segment. Da Onkel P. mit der anderen Tante aber ein komplett identisches Segment an dieser Position teilt, muss es sich bei dem halbidentischen bei allen drei um dasselbe DNA-Segment handeln, also um das hellbraune, welches nicht von dem Großelternteil mit der Mutation vererbt wurde.
Tante G. und mein Vater (D steht im Schaubild für „Dad“) teilen um 46 Mb herum gar keine gemeinsame DNA, also stammt die DNA an dieser Stelle bei beiden von zwei verschiedenen Großeltern. Daher werden ihm andere Farben zugeordnet, als meiner Tante.
Jetzt kommt der Vergleich mit V.K., einer Cousine väterlicherseits ins Spiel, der zusammen mit den oberen Informationen und den logischen Schlussfolgerungen daraus, meinen Großvater Alexander als Träger der Mutation identifiziert. (Auch der Vergleich mit A.S., einem zweiten Cousin väterlicherseits aus einer anderen Linie, führte zum gleichen Ergebnis.)
V.K. teilt mit drei Geschwistern ein durchgehendes Segment von etwa 30 Mb bis 107 Mb – nur mit Tante G. nicht. Diese drei Geschwister haben an der Position um 46 Mb also ein identisches DNA-Segment von demselben Großelternteil väterlicherseits bekommen, welches im Schaubild als mattgrün markiert ist. Das bedeutet, dass das halbidentische DNA-Segment, welches Tante G. mit Tante L. als auch Onkel P. teilt, sich auf ihrer mütterlichen Seite befinden muss (im Schaubild als hellbraun markiert). Und das wiederum bedeutet, dass das DNA-Segment mit der CCR5 Delta 32 Mutation auf der väterlichen Chromosomenkopie von Tante G. liegt!
(Die farblichen Balken stellen natürlich nicht das gesamte Chromosom 3 dar, sondern nur die Position um 46 Mb.)
Zum jetzigen Zeitpunkt kann ich noch nicht sagen, ob mein Großvater väterlicherseits diese Mutation von seinem Vater oder von seiner Mutter bekommen hatte oder ob bei derjenigen Person die Mutation auf beiden Chromosomenkopien vorlag, da mir von seinen Geschwistern nur ein Allel bekannt ist. Trotzdem werde ich das Ganze im Hinterkopf behalten, insbesondere weil meine Urgroßmutter Domna Pimshina indigener Herkunft war und diese Deletion bei den Mordwinen2 und Pomoren6, zwei indigenen Populationen Russlands, besonders häufig vorkommen soll. Um welches indigenes Volk es sich bei ihren Vorfahren handelt, ist mir zum jetzigen Zeitpunkt nämlich nicht bekannt. Vielleicht ist diese Mutation ja sogar ein Hinweis? (Der Kirchengemeinde aus dem Ort meiner Großeltern väterlicherseits soll nämlich auch eine Gruppe von 128 Pomoren angehört haben, sogenannte Altgläubige.)
Diese Mutation kam bereits in den folgenden Beiträgen von amerikanischen DNA-Genealogen vor:
QUELLENANGABEN ZU DEN ALLGEMEINEN INFORMATIONEN ÜBER DIE CCR5 DELTA32 MUTATION:
1. https://genetics.thetech.org/original_news/news13
2. https://pubmed.ncbi.nlm.nih.gov/9466996/
3. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1377146/pdf/9585595.pdf
4. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC299980/
5. https://www.ncbi.nlm.nih.gov/pubmed/14636691
6. http://www.dna-technology.ru/files/images/d/0b136b567d25d4be1dfa26a8b39ec2b9.pdf
7. https://en.wikipedia.org/wiki/CCR5
Views: 502