MENÜ MENÜ  

cover

Funktionelles Clustering von Genen mit der Gene Ontology

Nora Speer

ISBN 978-3-8325-1406-8
166 Seiten, Erscheinungsjahr: 2006
Preis: 40.50 €
Mit der Erfindung und dem Einsatz von Hochdurchsatzmethoden in der Molekularbiologie, sind Forscher in der Lage, sehr große Datenmengen in relativ kurzer Zeit zu sammeln. Während der Analyse dieser Daten wird schnell deutlich, dass die Integration von bereits vorhandenem biologischen Wissen in den Analyseprozess eine der neuen großen Herausforderungen der Bioinformatik darstellt. Die vorliegende Arbeit leistet hierzu einen Beitrag und konzentriert sich auf das Clustering von Genen bzgl. ihrer Funktion. Sie beschäftigt sich in diesem Zusammenhang mit den drei Teilbereichen Clustervalidierung, Clusteralgorithmen und biologische Ähnlichkeitsfunktionen.

Bekannte Clusterindices werden erstmals mit biologischen Distanzmaßen kombiniert und sofern nötig dafür erweitert. Die entwickelten Indices erlauben eine biologische Evaluation von Gengruppen, wie z.B. Genexpressionsclustern oder Clustern von Gensequenzen, um die Cluster herauszufinden, die biologisch interessant sind. Die dazu benötigten biologischen Distanzmaße für Gene werden mithilfe von Gene Ontology Annotationen berechnet, die in den meisten öffentlichen Datenbanken verfügbar sind. Die Gene Ontology (GO) ist eine Taxonomie, die fachspezifisches, biologisches Wissen in einer für Computer prozessierbaren Form zur Verfügung stellt.

Das Clustering mit GO-basierten Distanzen stellt an den verwendeten Clusteralgorithmus andere Ansprüche als ein rein numerischer Datensatz, da z.B. GO-basierte Mittelwerte zwischen Genen nicht berechnet werden können. Viele konventionelle Clusteralgorithmen werden vor diesem Hintergrund unbrauchbar. In der vorliegenden Dissertation wurde daher ein neues, auf einem Evolutionären Algorithmus basierendes, Clusterverfahren (MST-MA) entwickelt. Der Einfluss der verschiedenen Parameter des MST-MA auf die Qualität der gefundenen Lösungen wird untersucht, und der MST-MA wird mit anderen für das Problem geeigneten Clusterverfahren verglichen.

Des Weiteren sind bei der Arbeit mit den vorhandenen biologischen Distanzfunktionen für Gene einige gravierende Mängel dieser Unähnlichkeitsmaße deutlich geworden. Daher wurden vier neue Ähnlichkeitsfunktionen entwickelt, bei denen diese Nachteile nicht mehr bestehen. Wir untersuchen und vergleichen die vier verschiedenen Ähnlichkeitsmaße ausführlich und testen sie in Verbindung mit Spektralclustering, dualem K-Means und Average Linkage Clustering. Die gewählte Repräsentation als Empirical Kernel Map ermöglicht, dass nun auch GO-basierte Mittelwerte zwischen den Genen berechnet werden können. Bei allen Ähnlichkeitsmaßen handelt es sich um Kernelfunktionen, was sie auch für andere Verfahren, wie z.B. Support Vektor Maschinen, interessant macht. Grundsätzlich sind die vorgestellten Ähnlichkeitsfunktionen jedoch offen für jede Art von maschinellem Lernenverfahren, das funktionale Ähnlichkeiten verwenden soll.

Keywords:
  • Bioinformatik
  • Clustering
  • Gene Ontology
  • Data Mining
  • GO-Ähnlichkeitsfunktionen

KAUFOPTIONEN

40.50 €
auf Lager
Versandkostenfrei innerhalb Deutschlands


Wollen auch Sie Ihre Dissertation veröffentlichen?

cover cover cover cover cover cover cover cover cover