Das 1000 Genome Projekt 



Die Erstellung des Kataloges der menschlichen DNA Polymorphismen durch Next Generation Sequencing


99% der Gene sind bei allen Menschen identisch. Wissenschaftler interessieren sich jedoch vor allem für das eine Prozent der Unterschiede, da dieses nach unserem bisherigen Wissen für die individuelle Empfänglichkeit gegenüber Krankheiten, Medikamenten und Umwelteinflüssen verantwortlich ist. Das Erstellen einer genauen Karte solcher Unterschiede im Erbmaterial verschiedener Individuen ist Ziel des internationalen 1.000 Genome Projekts (www.1000genomes.org), das im September 2007 in Hinxton, UK, geplant und im Januar 2008 begonnen wurde. Im August 2008 wurde das Max-Planck-Institut für molekulare Genetik aus Berlin als Partner in das internationale Konsortium aufgenommen. Im Oktober 2008 konnte die Datenproduktion der Pilotphase des Projektes erfolgreich abgeschlossen werden.

Ziel des 1.000 Genome Projekts ist es, sämtliche Varianten von Genen in einem Katalog zu erfassen, die mit einer Häufigkeit von mindestens 1% im Erbgut der gesamten Menschheit vorkommen. Dafür wollen die Wissenschaftler das Erbgut von über 1.000 einzelnen Personen analysieren. Die Proben hierfür wurden bei den unterschiedlichsten Volksgruppen gesammelt. Die Forscher gehen davon aus, dass sie durch die neuen Kenntnisse über die natürliche Genvariation beim Menschen in künftigen Projekten mehr über die Rolle der einzelnen Variationen bei der Entstehung von Krankheiten wie Krebs, Diabetes oder Störungen des Herz-Kreislaufsystems erfahren.

In den ersten zehn Monaten des Projektes, der sogenannten Pilotphase, wurden 3.8 Terabasen DNA Sequenz generiert. Dies entspricht einer über 1.000-fachen Abdeckung des humanen Genoms. Während September and Oktober 2008 produzierte das 1.000 Genome Projekt jede Woche das Äquivalent der großen Datenbank „GenBank“. Insgesamt 75 Milliarden Basen mussten die Wissenschaftler um Hans Lehrach in dieser Phase sequenzieren, um für die weitere Teilnahme an dem Projekt zugelassen zu werden. Eine besondere Herausforderung für die Berliner Forscher, die erst im August in das 1.000 Genome Konsortium aufgenommen worden waren und daher nur zwei Monate für die Bewältigung dieser Aufgabe zur Verfügung hatten. Bis Frühjahr 2010  läuft die sogenannte Produktionsphase 1 des Projektes. Die Auswertung der Daten wird aber noch das gesamte Jahr 2010 in Anspruch nehmen. Etwa 700 Milliarden Basen sollen allein im MPI für molekulare Genetik in dieser Phase 1 sequenziert werden - im Gesamtprojekt werden je 400 Proben aus drei Populationen mit einer vierfachen Sequenziertiefe analysiert. In der für das zweite Halbjahr 2010 vorgesehenen Phase 2 des Projektes wird die Anzahl der zu analysierenden Proben weiter auf 2000 bis 2500 gesteigert werden, wobei neue Populationen in das Projekt integriert werden. Die Ergebnisse werden in öffentliche Datenbanken eingereicht und stehen so der wissenschaftlichen Fachwelt zur Verfügung.