Ergebnisse

  1. Ergebnisse mittels Methode 1 (Upstream Region herausgeschnitten)
  2. Ergebnisse mittels Methode 2 (TF extrahiert Sequenzen)

Die Ergebnisse aus dem "pwmatch" Vergleich können mit dem Skript "results2table.pl" in HTML- oder Text-Form gebracht werden.

Ergebnisse mittels Methode 1

Dialign und mAAna_tropy.pl

FootPrinter

Ergebnisse mittels Methode 2

Dialign und mAAna_tropy.pl

FootPrinter

 

Zum FootPrinter:

Wie unschwer aus den obigen Tabellen zu sehen ist, findet pwmatch eigentlich nur 3 Matrizen wieder in den vom FootPrinter ausgegebenen Sequenzen. Ein Grund dafür ist die zu kurze Sequenzlänge. Viele der annotierten Elemente sind wesentlich länger als der zugelassene und empfohlene Bereich des entsprechenden Parameters des FootPrinters. Wir haben eine Länge von 10 gewählt, bei denen obige 3 Matrizen auch wiedergefunden wurden. Erhöht man diesen Paramter (valid range laut manual ist 6-16), sinkt die Zahl der verwertbaren konservierten Regionen dramatisch; die Alignments haben dann zu weit mehr als 50% lediglich 2 Sequenzen, wurden also in 2 von 13 Organismen gefunden. Im Vergleich zu Dialign scheint hier sehr viel Information verloren zu gehen. Die FootPrinter Ergebnisse können also nicht für weitere Betrachtungen verwendet werden.

Zu Dialign:

Im Gegensatz zum FootPrinter wurden hier alle Matrizen gefunden. In der Tabelle sind die Matrizen aufgelistet, die am konserviertesten waren (min. 7 Organismen mit score >= 0.85)

Methode 1 Methode 2
arcA  
  dnaA
farR farR
  fnr
hns hns
malT malT
metJ  
torR torR

Die Matrizen stammen aus E.coli K12, wurden aber nicht wie erwartet mit sehr hohem Score in selbigem immer gefunden. Um zu sehen, ob dies vielleicht an den Verfahren liegt, wurde zum Vergleich pwmatch mit den matrizen noch auf den Ausgangsdaten der beiden Methoden gestartet:

Dateien: "pre_methode1.tar.gz" & "pre_methode2.gz"

Achtung, hier sind die Matrizen aufgeführt, die obige Auswahlkriterien nicht erfüllen!!!

methode1_upstream methode2_tf
ada ada
araC araC
cysB cysB
  deoR
  fadR
  fhlA
  fis
flhCD flhCD
hipB hipB
ihf ihf
  ilvY
lacI lacI
marR marR
melR melR
  metJ3
  modE
oxyR oxyR
rhaS rhaS
rpoD15 rpoD15
  rpoD16
  rpoD17
  rpoD18
  rpoD19
rpoE rpoE
rpoH2 rpoH2
rpoH3 rpoH3
  rpoS17
rpoS18 rpoS18
  soxS
tus tus

Wie man sieht, fallen bei Methode 2 schon von vornherein etliche Sequenzen weg, was aber auf den unter "Durchführung" beschriebenen Fehler zurückzuführen sein könnte.