NGFN-PLUS

Datenintegration und Erstellung von Phänotyp-Protein-Wirkstoff Netzwerken

Leitung:    Dr. Miguel Andrade
Institut: Max-Delbrück-Centrum für Molekulare Medizin (MDC) Berlin-Buch
Homepage: cbdm.mdc-berlin.de/
Ziel dieses Teilprojekts war die Erstellung von Datenbanken für alle von den Projektpartnern generierten Daten. Wir kombinierten diese Informationen mit externen öffentlichen Daten um neue Zusammenhänge zwischen Genen, Wirkstoffen und neuronalen Krankheiten vorherzusagen.
Auf der Grundlage von Phänotyp-Genotyp-Beziehungen gelangen uns neue Vorhersagen für Assoziationen zwischen (i) Genen und Krankheiten, (ii) Protein-Protein-Interaktionen (PPIs) oder funktionellen Modulen und Krankheiten, und (iii) Medikamenten, die Wirkungen auf Gene oder Funktionsmodule zeigen.
Die NeuroNet-Datenbank wurde entwickelt, um die im Projekt generierten Daten zugänglich und durchsuchbar zu machen (Manuskript in Vorbereitung). Zur Integration unserer Ergebnisse mit experimentell verifizierten PPI-Daten wurde die HIPPIE-Datenbank aufgesetzt (Schaefer et al, PLoS One 2012. Schaefer et al, PLoS Biol Comp, 2013; Von Eichborn et al, Nucleic Acids Res. 2013). Anhand der dort konzentrierten Informationen erhielten wir neue Einblicke in die Proteinaggregationsmechanismen neuronaler Erkrankungen (Petrakis et al, BioEssays, 2013;. Petrakis et al, PLoS Genetics, 2012; Schaefer et al, Nucleic Acids Res., 2012). So konnten wir die Funktionen von Polyglutaminketten aufdecken, zu denen wir das in Abb. 1 gezeigte Modell vorschlagen.
Weiterhin entwickelten wir Daten- und Text-Mining-Methoden, um literaturbekannte experimentelle und Krankheitsdaten mit Geninformationen zu kombinieren (Ortuño et al, BMC Bioinformatics 2013; Fontaine et al, Nucleic Acids Res. 2011; Barbosa-Silva et al, BMC Bioinformatics 2011; Donard et al, BMC Genomics, 2011). In Zusammenarbeit mit unseren klinischen Partnern (Charité Berlin; Manuskript in Vorbereitung) untersuchten wir solche Systeme, um Genotyp-Phänotyp-Beziehungen in neuronalen Krankheiten zu definieren und neue Wirkstoffe vorherzusagen.
Es entstanden neuartige bioinformatische Analysemethoden für Yeast-2-Hybrid-Daten, die wir auf neuronale Krankheitsproteine anwendeten (Suter et al., Nucleic Acids Res., 2013). Untersuchungen von RNAseq-Daten und Huntington(HD)-Patientenmaterial dienten der Identifikation von Markern bei HD.
Die Arbeiten in Teilprojekt 8b wurden getragen durch die enge Zusammenarbeit und den Austausch von Daten und Ideen mit dem Team von Prof. Dr. P. Bork (EMBL Heidelberg).



Abbildung 1. Möglicher Mechanismus der Funktion von Polyglutamin- (PolyQ) Ketten Links: Ein PolyQ-Protein enthält eine coiled coil-Domäne (blau), der ungeordnete PolyQ- (rot) und Polyprolin- (polyP) Regionen (grün) folgen. Rechts: Während einer Interaktion mit einem Protein X nimmt die polyQ-Sequenz eine coiled coil-Struktur an, die eine Verlängerung der ursprünglichen Domäne darstellt. Die polyP-Region bleibt ungeordnet und begrenzt präzise die coiled coil-Region.

Weitere Teilprojektleiter: