Subscribe to Newsfeeds

Analyse von genomischer Variation

Jede unserer Körperzellen trägt eine vollständige Kopie unserer DNA in sich und damit unser vollständiges Erbgut, das auch als Genom bezeichnet wird. Das Genom ist in Chromosomen organisiert: Wir erben jeweils 23 Chromosomen von unserer Mutter und unserem Vater. Ein Chromosom besteht aus einem sehr langen DNA-Molekül, welches durch spezielle Proteine stabilisiert und räumlich angeordnet wird. Die DNA kodiert genetische Informationen als Abfolge von vier verschiedenen Basen: Adenin (A), Cytosin (C), Guanin (G) und Thymin (T). In diesem Sinne kann ein Chromosom vereinfacht als eine Sequenz der Buchstaben A, C, G und T betrachtet werden. Die Genomforschung beschäftigt sich demnach mit der Frage, wie unsere Genomsequenz individuelle Merkmale beeinflusst, also welche kausalen Zusammenhänge zwischen genetischer Variation und der Ausprägung verschiedener Merkmale bestehen. Viele verschiedene Eigenschaften kön- nen dabei von Interesse sein: Körpergröße, die Anfälligkeit für eine bestimmte Krankheit oder die Intoleranz gegenüber einem bestimmten Arzneimittel.

 

 

Abbildung: Während die Genome aller Menschen zu über 99 % identisch sind, zeigen sich jedoch an bestimmten Positionen Unterschiede. Diese genomische Variabilität ist wichtig für die Weiterentwicklung der Spezies Homo sapiens. Einige dieser genomischen Varianten erhöhen aber das Risiko für bestimmte Erkrankungen.

 

Genetische Veränderungen, die Ursache bestimmter Merkmale sind, befinden sich meistens in den Genen. Dies sind DNA-Regionen, die als Blaupause für Proteine dienen – oder sie liegen in Regionen, die steuern, wie viel von einem ge- wissen Protein produziert wird. Aus den in der DNA kodierten Genen, die man sich wie oben erwähnt als Baupläne vorstellen kann, werden in zwei Schritten Proteine hergestellt. Als erstes werden Kopien dieser DNA-Abschnitte erstellt, die dann als RNA-Moleküle vorliegen. Dieser Vorgang heißt Transkription. Danach werden aus den RNA-Molekülen Proteine produziert, die eine Vielzahl von Funktionen ausüben. Somit wirken sich Änderungen in der DNA über den Umweg der RNA auf die hergestellten Proteine aus. Diese Veränderungen können beträchtliche Auswirkungen auf die Ausprägung von Merkmalen haben und zum Beispiel die Ursache einer genetischen Krankheit sein.

Aber wie können Unterschiede in der DNA oder RNA gemessen werden? In beiden Fällen können hochmoderne Sequenzierverfahren (engl. next generation sequencing, NGS), die ständig weiterentwickelt werden, Verwendung finden. Die Analyse der bei der Sequenzierung entstehenden riesigen Datenmengen stellt Wissenschaftler vor Herausforderungen im Bereich der Informatik, Mathematik und Statistik. Forscher am Zentrum für Bioinformatik stellen sich diesen Herausforderungen und haben wesentlich zur Weiterentwicklung moderner Analysemethoden von DNA- sowie RNA-Sequenzierdaten beigetragen.