NGFN-PLUS

Genetische Epidemiologie

Leitung:    Prof. Dr. Michael Krawczak
Institut: Institut für Medizinische Informatik und Statistik
Homepage: www.uni-kiel.de/medinfo/
Genomdaten werden durch die parallele Genotypisierung Hunderttausender genetischer Marker, durch die Sequenzierung ganzer Genome oder von Teilen dieser Genome erzeugt. Art und Umfang dieser Daten stellen große Anforderungen an ihre Speicherung, Verarbeitung und Analyse. Das Teilprojekt hat wichtige Beiträge zu allen drei Aspekten geliefert, insbesondere bei der mathematischen und statistischen Modellierung solcher Daten. Neuentwickelte Datenbankenlösungen ermöglichen eine konsistente Datenhaltung und einen schnellen Zugriff. Semiautomatisierte Qualitätskontrollen lieferten qualitativ hochwertige Daten für belastbare Analyseergebnisse. Modellierungsansätze für die Qualitätskontrolle waren z.B. die Evaluierung der Genomabdeckung spezifischer Markersätze und die Abschätzung der relativen Wahrscheinlichkeit, echte Krankheitsassoziationen zu entdecken. Insbesondere konnten verschiedene Signaturen von Fehlern der unterschiedlichen Sequenzierungsplattformen nachgewiesen und ihr Ausmaß quantifiziert werden. Das bedeutet, dass bei einer Kombination von Daten verschiedener Plattformen verfälschte Analyseergebnisse zu erwarten sind. Zahlreiche weitere theoretische und praktische Studien verbesserten die Analyse genomischer Daten. So wurde in europäischen Stichproben ein Gradient im Vorkommen langer homozygoter Abschnitte nachgewiesen und die Leistungsfähigkeit von Genotyp-Prädiktionsalgorithmen (Imputation) evaluiert. Kooperationspartner wurden bei statistischen Analysen, etwa zum Zusammenwirken von Genen und von Umweltfaktoren, unterstützt. Weiterhin wurden neuartige Ansätze zur Entdeckung von genetischen Varianten, die Einfluss auf die Entstehung von zwei oder sogar mehr Erkrankungen haben, entwickelt und erfolgreich eingesetzt. Es wurde ein neuartiger Analyseansatz zur Entdeckung von sogenannter Allelischer Imbalance, bei der von den Kopien der beiden homologen Chromosomen nur eines in Proteinvorstufen (Transkripte) umgeschrieben wird, entwickelt. Dieser neue Ansatz zeichnet sich durch das Zulassen von Fehlern in Sequenzdaten aus und erzielt so eine  höhere Detektionsrate als klassische Verfahren, was ihn insbesondere für die Analyse von Tumorzellen interessant macht. Insgesamt hat das Teilprojekt, mit einem mathematisch-statistischen Schwerpunkt, einen essentiellen Beitrag zur Aufklärung genetischer Ursachen von Erkrankungen geleistet, aber darüber hinaus auch einige allgemeine Muster der genetischen Vielfalt in europäischen Populationen erstmalig beschrieben.
Weitere Teilprojektleiter: