Technologien der Genomforschung

Ausgesuchte Methoden der Genomforschung

Die Genomforscher arbeiten nicht nur mit einzelnen Genen, sondern mit ganzen Genomen, nicht nur mit einzelnen Patienten sondern mit Patientenkohorten, nicht nur an einzelnen Krankheitsbildern, sondern an krankheitsübergreifenden Mechanismen. Für die Genomforschung reichen daher molekularbiologische Methoden im „normalen“ Labormaßstab oft nicht aus.
Es wurden und werden daher Hochdurchsatzverfahren entwickelt, mit deren Hilfe in kurzer Zeit sehr viele Analysen möglich sind und so große Datenmengen erzeugt werden. Diese Datenmengen in auswertbare Informationen zu übersetzen ist die Aufgabe der Bioinformatik, die in diesem Zusammenhang eine immer wichtigere Rolle spielt.

Einige der wichtigsten Methoden der Genomforschung sollen hier vorgestellt werden:

DNA Sequenzierung



Erst durch die DNA-Sequenzierung konnte die Ära der Genomforschung eingeleitet werden. 1977, etwa 35 Jahre nach der Entschlüsselung der Struktur der DNA, wurden parallel zwei Technologien entwickelt, durch die die Abfolge der Bausteine auf der DNA aufgeklärt werden konnte. Fred Sanger entwickelte eine Methode, durch die neue DNA enzymatisch erzeugt wird, welche anschließend analysiert werden kann. Die Sequenzierung nach Maxam und Gilbert dagegen erfolgt mittels eines chemischen Abbaus der DNA. Sanger und Gilbert erhielten für die Entwicklung ihrer jeweiligen Sequenziermethoden 1980 den Nobelpreis für Chemie. Vor allem aufgrund der Automatisierbarkeit, der Qualität der Sequenzen und der längeren Leseweiten hat sich jedoch die Sanger-Sequenzierung durchgesetzt. Sequenziermethoden der nächsten Generation („Next generation sequencing“), wie beispielsweise die 1996 entwickelte Pyrosequenzierung, sind aus der Genomforschung heute nicht mehr wegzudenken und bieten die Möglichkeiten der Hochdurchsatz-Sequenzierung.

Bei der Sequenzierung nach Allan Maxam und Walter Gilbert wird die DNA zunächst an einem Ende markiert. In vier getrennten Ansätzen wird nun jeweils eine der Basen modifiziert und abgespalten. Danach wird der DNA-Strang an den jetzt basenlosen Stellen komplett gespalten. In jedem Ansatz entstehen Fragmente unterschiedlicher Länge, an deren Ende stets eine bestimmte Base vorhanden war, die dann abgespalten wurde. Die Fragmente werden über die sogenannte Gelelektrophorese nach ihrer Länge aufgetrennt, wobei Längenunterschiede von einer Base erkennbar sind. Durch Vergleich der vier markierten Ansätze auf dem Gel lässt sich die Sequenz der DNA ablesen.

Die Didesoxymethode der Sequenzierung, auch Kettenabbruch-Synthese genannt, wurde 1975 von Frederic Sanger und Alan Coulson entwickelt. Dabei wird die DNA-Doppelhelix zunächst durch Erwärmung in Einzelstränge zerlegt. Dann wird, ausgehend von einem kurzen Abschnitt bekannter Sequenz (Primer) mit Hilfe des Enzyms DNA-Polymerase einer der beiden komplementären DNA-Stränge verlängert. In vier parallelen Ansätzen sind jeweils alle vier Nukleotide (NTPs) enthalten, zusätzlich jedoch wird je eine der vier Basen zum Teil als Didesoxynukleosidtriphosphat (ddNTP) zugegeben. Der neue DNA-Strang wird so lange weiter synthetisiert, bis statt des entsprechenden normalen NTPs ein ddNTP eingebaut wird. Dieses bewirkt einen Abbruch der Synthese, da kein neues Nukleotid mehr daran verknüpft werden kann. In der Folge entstehen DNA-Fragmente unterschiedlicher Länge, die in jedem Ansatz stets mit dem gleichen ddNTP enden. Entweder der Primer oder die ddNTPs sind radioaktiv markiert. Nach der Sequenzier-Reaktion werden die Abbruchprodukte aus jedem Ansatz mittels Gelelektrophorese der Länge nach aufgetrennt. Durch Vergleich der vier Ansätze kann man die Sequenz des synthetisierten Stranges ablesen. Die dementsprechend komplementäre Sequenz ist die Sequenz der verwendeten einsträngigen DNA-Matrize. Seit einigen Jahren werden vor allem mit Fluoreszenz-Farbstoffen markierte ddNTPs eingesetzt, wobei jedes an einen unterschiedlichen Farbstoff gekoppelt ist. Auf diese Weise können alle vier Ansätze in einem Reaktionsgefäß durchgeführt werden. Die entstehenden Kettenabbruchprodukte werden mittels Kapillarelektrophorese aufgetrennt und mit Hilfe eines Lasers zur jeweiligen Fluoreszenz angeregt. Die Abfolge der Fluoreszenz-Farbsignale, die am Detektor erscheinen, gibt direkt die Sequenz der Basen des DNA-Stranges wieder.


Next Generation Sequencing


Etwa 30 Jahre lang beherrschte für das Entziffern des DNA-Codes die Sanger-Sequenzierung den Markt. Inzwischen haben jedoch die sogenannten „Next Generation Sequencing“ Technologien zu einer Revolution geführt. Die meisten dieser Hochdurchsatz-Methoden verwenden nicht mehr eine Auftrennung der DNA über Kapillarelektrophorese, sondern eine Kopplung von Molekülen an Oberflächen und Aufnahmen von Reihen von hochauflösenden Bildern. Die aktuellen Next-Generation Sequencing-Geräte können mit geringem personellen Aufwand innerhalb von 24 Stunden so viele Daten erzeugen wie zuvor hunderte von „Sanger-Typ Kapillar“-Sequenzierern. Dabei verbergen sich hinter dem Begriff Next-Generation Sequencing verschiedene Methoden.


Die Pyrosequenzierung beispielsweise wird oft zur sogenannten de novo-Sequenzierung bisher völlig unbekannter DNA verwendet. Sie ist gut automatisierbar und eignet sich zur hochparallelen Analyse von DNA-Proben. Die Pyrosequenzierung basiert wie die Sanger-Methode auf dem Prinzip der Sequenzierung durch Synthese. Allerdings wird die DNA-Polymerase gewissermaßen „in Aktion” beobachtet, während sie nacheinander einzelne Nukleotide an einen neusynthetisierten DNA-Strang anhängt. Der erfolgreiche Einbau eines NTPs wird unter Beteiligung des Enzyms Luziferase in ein Lichtsignal umgesetzt und von einem Detektor erfasst. Die zu sequenzierende DNA dient als Matrizenstrang und liegt einzelsträngig vor. Ausgehend von einem Primer erfolgt die Strangverlängerung Nukleotid um Nukleotid durch deren kontrollierte Zugabe. Wird ein passendes (komplementäres) NTP zugegeben, erhält man ein Signal, bei den unpassenden NTPs bleibt dieses aus. Auf diese Weise kann die DNA-Sequenz direkt bestimmt werden.

Eine andere Methode nutzt die Brücken-Amplifikation, bei der sehr viele kurze Stücke der Erbsubstanz auf einer Platte aufgebracht und gleichzeitig Base für Base entschlüsselt werden. Diese Methode vermag hohe Datenmengen zu erzeugen und ist besonders hilfreich, wenn bereits eine Referenzsequenz zur Einordnung der Sequenzabschnitte vorhanden ist.

Ligationsbasierte Methoden sind wiederum ideal geeignet, um gezielt nach bereits bekannten Sequenzen (z. B. Genvarianten, die ein Krankheitsrisiko bedeuten können) zu suchen.

Durch diese Innovationen wird hochparalleles und schnellstes Arbeiten zu immer günstigeren Preisen möglich, während die Prozesse stetig verbessert und weitere Technologien entwickelt werden. Mit den NGS-Technologien kann derzeit in 8 Wochen für 100.000 Dollar ein gesamtes menschliches Genom sequenziert werden – eine Aufgabe, die im humanen Genomproject (HGP) noch 13 Jahre, Tausende von Mitarbeiten und 300 Millionen Dollar benötigt hatte.

GWAS: Genomweite Assoziationsstudien

Die Abkürzung GWAS steht für den Begriff genomweiten Assoziationsstudien. Diese sollen  helfen, den genetischen Hintergründe von Krankheiten auf die Spur zu kommen. Meist tragen zu solchen Studien zwei Gruppen von Teilnehmern bei. Die „Patientengruppe“ beinhaltet Menschen, die unter einer bestimmten Erkrankung leiden, wohingegen für die „Kontrollgruppe“ Personen ausgewählt werden, die eben nicht die untersuchte Krankheit haben. Nun werden die genetischen Eigenschaften (nicht die gesamte Erbinformation, sondern bestimmte Marker die sogenannten SNPs, Single Nucleotide Polymorphisms) aller Teilnehmer ermittelt und miteinander verglichen. Genvarianten, die besonders häufig bei den Patienten auftreten, haben mit großer Wahrscheinlichkeit etwas mit den Mechanismen der Krankheitsentstehung zu tun, sind also krankheitsassoziiert. Für die Analyse der immensen Datenmengen sind ausgefeilte informatische Auswertungsprogramme und große Computerkapazitäten erforderlich. Forscher aus dem NGFN konnten mithilfe von GWAS bereits für eine Vielzahl von Krankheiten zeigen, dass deren Entstehung durch bestimmte Genvarianten begünstigt wird. Solche Kandidatengene werden dann funktionell charakterisiert, um ihr Potential als therapeutische oder diagnostische Angriffspunkte auszuloten, was idealerweise zu einem neuen Medikament oder Testverfahren führt.

Microarrays

Auf einem sogenannten „Biochip“ (oder Microarray) sind wie auf einem Computerchip sehr viele Informationen (in diesem Fall mehrere Tausend Proteine, RNA- oder DNA-Fragmente) auf kleinstem Raum vorhanden. So können mit geringen Mengen an biologischem Probenmaterial sehr viele molekularbiologische Untersuchungen gleichzeitig und großteils automatisiert durchgeführt werden. Bereits wenige Jahre nach ihrer Entwicklung in den 1990er Jahren wurden sie zu einem wichtigen Werkzeug der medizinischen und biologischen Forschung und sind heute auch aus der Genomforschung nicht mehr wegzudenken.


DNA-Microarrays werden häufig für die Genomanalyse und die Diagnostik verwendet. Mit ihrer Hilfe können Forscher untersuchen, in welchem Ausmaß bestimmte Gene z.B. in bestimmten Geweben abgelesen werden, und daraus Rückschlüsse ziehen, welche Proteine dort gerade benötigt werden. Zur Herstellung eines DNA-Microarrays werden die zu untersuchenden bekannten DNA-Stücke entweder von speziellen Geräten mit hoher Präzision auf das Trägermaterial (z.B. speziell beschichtetes Glas oder Kunststoff) gedruckt ("Spotted Microarrays") oder es werden kürzere künstliche DNA-Fragmente Stück für Stück (Base für Base) direkt auf dem Chip zusammengebaut ("Oligonukleotide Microarrays"). Für das eigentliche Experiment wird aus dem zu untersuchenden Gewebe zunächst die gesamte mRNA (also die Abschriften verschiedener Gene, die gerade erstellt wurden um als Vorlage für die Herstellung der entsprechen Proteine zu dienen) extrahiert und nach eventuellen Aufreinigungs- und/oder Vermehrungsschritten in eine DNA- (oder RNA-) Kopie umgeschrieben. Diese Kopie wird beispielsweise mit einem fluoreszierenden Farbstoff markiert. Den Kopien-Mix gibt man auf den Chip. Da die Kopien die gegenläufige (komplementäre) Sequenz zu den auf dem Chip befindlichen Gen-Fragmenten haben, binden sie fest an Ihren Gegenpart (sofern dieser auf dem Array vorhanden ist), indem sich die entsprechenden Basen paaren. Es entsteht ein stabiler Doppelstrang. Diesen Vorgang nennt man Hybridisierung. Nach Abwaschen der nicht gebundenen Kopien wird die Intensität (bzw. das Farbmuster, falls zwei zu vergleichende Proben mit unterschiedlicher Markierung gleichzeitig aufgetragen werden) des Fluoreszenzsignals jeder Position des DNA-Microarrays mit Hilfe eines Lasers ausgelesen. Es kann damit beispielsweise bestimmt werden, wie „aktiv“ jedes der auf dem Chip vorhandenen, bekannten Gene im untersuchten Probenmaterial zum Zeitpunkt der Entnahme war. Eine andere Variante von DNA-Microarrays ermöglicht den Vergleich von tausenden von Basen in unterschiedlichen Abschnitten des menschlichen Genoms.
Mit ihrer Hilfe wurde im NGFN eine großangelegte genomweite Assoziationsstudie durchgeführt, bei der große Patienten-Kohorten für 28 verschiedene Krankheiten genotypisiert und auf genetische Variationen (SNPs: Einzelnukleotid-Sequenzvariationen; engl.: Single Nucleotide Polymorphism) im Vergleich zu Kontrollgruppen untersucht wurden. Mithilfe der SNPs können Krankheitsgene lokalisiert werden.





Bei Protein-Microarrays werden statt der DNA-Kopien kleine Protein-Mengen auf dem Trägermaterial aufgebracht.
Die Chips werden mit einer proteinhaltigen Probe, zum Beispiel einem Antikörper, inkubiert, wobei dieser dann an einige der auf dem Chip befindlichen Protein-Spots bindet. Nach der Durchführung eines Waschschritts, bei dem ungebundener Antikörper entfernt wird, kann die Stärke des Signals jedes Spots und damit die Menge des dort gebundenen Antikörpers aus der Probe ermittelt werden. Das Signal entsteht beispielsweise durch einen weiteren Antikörper, der an einen fluoreszierenden Farbstoff gebunden ist und wiederum an den ersten Antikörper bindet.
Man kann die verschiedenen Protein-Microarray-Arten nach der Art der Interaktion (Antigen-Antikörper, Enzym-Substrat, Rezeptor-Protein oder allgemeine Protein-Protein Interaktion) unterscheiden. Es kann auch differenziert werden, ob Proteine der Probe am Array fixiert werden und dann mit einer Vielzahl von spezifischen, bekannten Testproteinen geprüft wird - oder ob die Testproteine in den Testflächen fixiert werden und dann die Reaktion mit den Probenproteinen erfolgt.
Ein Vorteil gegenüber DNA-Microarrays ist die schnellere Analyse von Proben, da man auf eine Vermehrung des genetischen Materials sowie die Hybridisierung verzichten kann. Zudem lassen Protein-Microarrays eine Analyse des tatsächlichen Proteinlevels zu. Denn neuere Forschungsergebnisse lassen darauf schließen, dass mRNA- und Proteinmenge nicht immer miteinander korellieren, und man daher aus den DNA-Microarray-Ergebnissen nicht unbedingt auf die Höhe der Proteinexpression schließen kann.