NGFN-PLUS

Bioinformatik und Datenintegration

Leitung:    Dr. Ralf Herwig
Institut: Max Planck Institut für molekulare Genetik
Homepage: www.molgen.mpg.de
Ziel des NGFN-plus Verbundprojekts war die epigenetische Analyse von Darmkrebstumoren in Mensch und Maus sowie die Identifizierung von wichtigen Modifizierungsgenen bei der Krebsentstehung.

Das Teilprojekt „Bioinformatik und Datenintegration“ hat dazu die grundlegenden bioinformatischen Arbeiten geliefert:

1. Die Meta-Datenbank ConsensusPathDB, die die weltweit größte Datensammlung für humane molekulare Interaktionen enthält, wurde auf murine Interaktionen erweitert. Die Datenbank erlaubt die Interpretation genomischer Daten im Kontext molekularer Netzwerke und somit eine funktionelle Analyse der der Tumorentstehung zugrunde liegenden Wirkmechanismen [2].

2. Eine komplette bioinformatische Lösung zur Prozessierung und Analyse von genomweiten Methylierungsdaten wurde entwickelt (MEDIPS, [3]). Die Software musste einerseits sehr robust sein, um die gewaltigen Datenmengen aus der Sequenzierung schnell zu bearbeiten (ca. 1 TB pro Experiment), andererseits bestanden besondere Anforderungen an die Spezifizität der Analysekomponenten, um aus diesen Datenmengen Tumor-relevante Information zu extrahieren. Alle Projektdaten wurden durch die Pipeline prozessiert und mit anderen Datentypen (z.B. Patientendaten und Transkriptomdaten) integriert. Die Software ist in dem Statistikpaket R/Bioconductor als separates Paket nutzbar.

3. Konservierte molekulare Marker in Mensch und Maus auf der Basis von Methylierungs- und Transkriptionssignalen wurden identifiziert [1] und sind zur Zeit im Patentierungsverfahren.

Ausgewählte Veröffentlichungen:

[1] Grimm C, Chavez L, Vilardell M, Farrall AL, Tierling S, Böhm JW, Grote P, Lienhard M, Timmermann B, Walter J, Schweiger MR, Lehrach H, Herwig R, Herrmann BG, Morkel M (2013) DNA-methylome analysis of mouse intestinal adenoma identifies a tumour-specific signature that is partly conserved in human colon cancer. PLOS Genetics, 9(2):e1003250.

[2] Kamburov A, Stelzl U, Lehrach H, Herwig R (2013) The ConsensusPathDB interaction database: 2013 update. Nucleic Acids Research, 41(Database issue):D793-800.

[3] Chavez L, Jozefczuk J, Grimm C, Dietrich J, Timmermann B, Lehrach H, Herwig R(*), Adjaye J(*) (2010) Computational analysis of genome-wide DNA-methylation during the differentiation of human embryonic stem cells along the endodermal lineage. Genome Research, 20:1441-1450. (*) equal contribution

- ConsensusPathDB Meta-Datenbank für molekulare Interaktionen: consensuspathdb.org.
- MEDIPS Software: www.bioconductor.org/packages.