Maschinelles Lernen in der Biologie
(Karsten Borgwardt)
Das Forschungsgebiet war die Entwicklung von intelligenten Algorithmen zur Analyse von komplexen Systemen in der Biologie. Es befindet sich am Schnittpunkt zwischen maschinellem Lernen, Datamining und Bioinformatik und trägt zur Erkenntnis in diesen drei Gebiete bei. Unsere Forschung reichte tief in die Statistik, Algorithmik und das wissenschaftliche Rechnen hinein.
Die Arbeitsgruppe für „Maschinelles Lernen in der Biologie“ arbeitete im Bereich der algorithmischen Systembiologie. Die Forschung reichte tief in die Systembiologie, die Bioinformatik und die statistische Genetik einerseits und das Maschinelle Lernen, das Data Mining und das wissenschaftliche Rechnen andererseits. Wir entwickelten Algorithmen und statistische Tests, um die Auswirkungen einzelner Gene auf ein biologisches System untersuchen zu können. Die Verfahren, an denen wir arbeiteten, gehören zum Themengebiet des Maschinellen Lernens. Unter dem Maschinellen Lernen versteht man computergestützte statistische Verfahren, die nach Mustern und Zusammenhängen in Datenbeständen suchen.
Wir entwickelten solche Verfahren, um die Funktion eines Gens oder eines Moleküls vorhersagen zu können. Dabei sind graphbasierte Verfahren von besonderer Bedeutung, da man sowohl das Zusammenspiel von Genen und von Proteinen als auch die Struktur von Molekülen als Graphen oder Netzwerk darstellen kann. Aus diesem Grund beschäftigten wir uns intensiv mit dem Thema des Maschinellen Lernens auf Graphen und Netzwerken.
Des Weiteren arbeiteten wir an Verfahren des Maschinellen Lernens für genomweite Assoziationsstudien. Hier untersuchten wir, ob Sequenzunterschiede in den Genomen von Individuen zu veränderten Phänotypen führen. Mit Prof. Dr. Detlef Weigels Abteilung am Max-Planck-Institut für Entwicklungsbiologie in Tübingen analysierten wir, welche genetischen Faktoren Unterschiede in der Blühzeit von Arabidopsis thaliana erklären können. Mit dem Max-Planck-Institut für Psychiatrie in München erforschten wir die Frage, ob man vorhersagen kann, ob ein depressiver Patient positiv auf die Einnahme von Antidepressiva reagieren wird.