next up previous contents
Next: About this document ... Up: Bioinformatisches Praktikum: Modul 'Transkriptionsregulation' Previous: Durchführung   Contents


Ergebnisse

  1. Blast-Tabelle:

    Die Blast-Tabelle wurde schon in den Durchführung näher erläutert und soll hier nur der Vollständigkeit halber nochmals angeführt werden.

  2. Circal:

    Die Zusammenfassung der Meme-Hits wurden mit dem Programm Circal, von Fritzsch et al, näher analysiert. Dieses Programm ist eigentlich für Alignments von ringförmigen Sequenzen gedacht und wurde von uns somit etwas missbraucht. So musste ein künstlicher Start/Endpunkt erzeugt werden, der mit einem großen A in der unteren Grafik markiert ist.

    Die einzelnen Motive (Spalten der Grafik) wurden über alle Inputsequenzen (Zeilen der Grafik) alignt. Da auf Grund der Reihenfolge oder Zusammensetzung keine weiteren Informationen gewonnen werden konnten, haben wir diesen Weg nicht weiter verfolgt. Ein wünschenswertes Ergebnis wäre eine durchgängige grüne Markierung über alle Zeilen gewesen oder gebildete Blöcke von Motiven.

    Figure 5: Zusammenfassung der gefundenen Meme-Motive (max. Länge 10) wurde mit Circal alignt (siehe Text für mehr Informationen).
    \includegraphics[width=1.25\textwidth]{gfx/MEME_result10_censor.ps}
  3. xmgrace-Grafiken:

    Unser Ziel war es, verschiedene Programme zu testen und zu vergleichen. Die untere Grafik fasst die Ergebnisse quantitativ für jedes Programm zusammen. Das Programm Consensus ist in der Grafik nicht mit aufgeführt, da wir immer wieder nicht reproduzierbare Fehler bekamen. Des Weiteren ist Consensus auch nicht für höhere Organismen, wie die von unserer Gruppe betrachteten Vertebraten konzipiert.

    Figure 6: Die x-Achse ist die Position auf der 500nt langen Promotorsequenz und auf der y-Achse ist die Anzahl der gefundenen Motives über einen Sequenzbereich. Jede Farbe repräsentiert das jeweilige Programm, welches wir testeten.
    \includegraphics[width=1.1\textwidth]{gfx/vergelich_alles_hs_cd97.eps}

    Die Grafik gibt auf der x-Achse die Position in der 500nt langen Promotorsequenz an, wobei ab 501 der Transkriptionsstart lokalisiert wäre. Die y-Achse ist zweigeteielt. Alle Angaben größer Null geben die zum jeweiligen Programm die Anzahl der gefundenen Motive in den von uns betrachteden 16 Sequenzen. Da überlappende Hits in der gleichen Sequenz doppelt gezählt werden, sind auch Werte größer 16 möglich. Wie gut zu erkennen ist, sticht AlignACE durch ein starkes Rauschen und permanente Hit Vorhersage heraus. Nach einer weiteren Analyse dieser Hits stellte sich heraus, dass sehr viele Hits ineinander liegen. Es gibt nicht nur überlappende Hits, sondern innerhalb eines Bereiches liegen sehr viele Hits im selben Bereich. Die beiden folgenden Bilder zeigen, welchen Effekt es hat wenn man die ineinanderliegenden Hits auf einen reduziert. Der Unterschied macht eine Reduzierung von cirka 50% aus, aber dennoch sind so keine deutlichen bzw. vielversprechenden Hits erkennbar.

    Figure 7: Links die Anzahl der AlignACE Hits mit ineianderliegenden Hits und rechts die ineinanderliegende Hits reduziert auf einen.
    \includegraphics[width=0.8\textwidth]{gfx/mit.eps} \includegraphics[width=0.8\textwidth]{gfx/ohne.eps}
  4. Bäume:
    MATRIX
    000000000000010000010001000000000000001
    000000000000000000010011000000010000001
    000000000001000000000011000000000000001
    000000000111000000000001000000000000001
    000000001001100000000000000000000000001
    000001000000000000000001000000010000011
    000000000000000000000001000001110000101
    000101000000000000010010000000010001001
    000101000000000000010010000000010001001
    000001110000010000010000000000010010001
    000001010000010000010001000000010110001
    000000000000010011111100000000000000001
    000000000000011110011000000000000000001
    000111000000000000000001000110011000001
    110001000000000000000001111000000000001
    111001000000000000010000111000000000001

    Um herauszufinden, ob bestimmte Motivgruppen in verschiedenen Spezies/Gattungen aufreten, haben wir alle detektierten Motive, die wir in der TRANSFAC oder JASPAR Datenbank finden konnten, in einer binären Matrix dargestellt. Die Zeilen repräsentieren jeweils eine Spezies, jede Spalte steht für ein bestimmtes Motiv. 1 bedeutet, Motiv in jeweiliger Sequenz vorhanden, 0 nicht vorhanden. Wir überführten diese Matrix in eine Nexus Datei und erstellten einen Distanzbaum mit SplitsTree.

    \includegraphics[width=1.5\textwidth]{gfx/tree.eps}

    Wie man sieht, ist die Variation der Motive aber zu groß, um bestimmte Gruppen identifizerien zu können.

Schlussfolgerung:

Wir haben alle Programme getestet und MEME scheint das vielversprechensde Tool zu sein. Das der Output maschinen- und menschenlesbar ist, ist nur einer der Vorteile von MEME. Der html-Output ist außerdem grafisch sehr gut aufbereitet und fasst die Ergebnisse ansprechend zusammen. Das eine Position Weight Matrix (PWM) leicht extrahierbar ist stellt sich für folgende Analysen als weiterer Vorteil heraus.


next up previous contents
Next: About this document ... Up: Bioinformatisches Praktikum: Modul 'Transkriptionsregulation' Previous: Durchführung   Contents
Sven Findeiss 2007-02-06