Verwendete Links und benutzte Programme

 

Links

Die wichtigste Seite ist die des National Center for Biotechnology Information (ncbi). Sämtliche von uns verwendete Dateien (*.gbk,*.ptt,*.rnt usw.) haben wir von diesem ftp Server.
ftp://ftp.ncbi.nlm.nih.gov/genomes/Bacteria/

Die online-Enzyklopädie Wikipedia mit nützlichen allgemeinen Informationen über Gammaproteobakterien.
www.wikipedia.org

Einordnung der Bakterien (verschiedene Quellen, da keine eindeutige Klassifizierung existiert)
http://ijs.sgmjournals.org/content/vol55/issue5/images/large/IJE67349-2c.jpeg
http://ijs.sgmjournals.org/content/vol55/issue5/images/large/IJE67349-2a.jpeg
http://www.genetics.org/cgi/reprint/168/3/1639
http://ijs.sgmjournals.org/cgi/content/full/55/5/2013
http://pubmedcentral.org/articlerender.fcgi?artid=1175084&rendertype=figure&id=F3

Allgemeine Bakterieninformationen
Biologie Wissensspeicher, Volk und Wissen Verlag GmbH

E. coli DNA-Binding Site Matrices für das E.choli K12 Genom

http://arep.med.harvard.edu/ecoli_matrices

Programme

dialign: multiples Alignmentprogramm

TF (C ): bildet orthologe Cluster (gruppiert Operons in Cluster)

Footprinter: Sucht mit Hilfe eines gegebenen phylogenetischen Stammbaumes stark konservierte Sequenzen innerhalb des Stammbaumes und gibt diese grafisch aus

aln2pattern & pwmatch : Matcht  DNA oder RNA-Sequenzen gegen positionsgewichtete Matrizen, um Wahrscheinlichkeiten des Vorkommens darin zu ermitteln

Skripte

proteinortho.pl : Finden von orthologe Genen

extract_XXX.pl : Aufgabe aller extract_XXX Skripte war es, die Intergensequenzen auszuschneiden (verschiedene Versionen wegen anderen Headern etc oder doppelten Clustern bei jedem der 4 Wege)

mAAna_tropy.pl ( dialign und anschließend maana_tropy zur weiteren Filterung der Daten)

extract_motifs : Extraktion der gefundenen konservierten Sequenzen vom Footprinter

collect_XXX : Verabeitung der mAAna_tropy/footprinter Ergebnisse und Zusammenfassen in eine Datei pro Organismus mit den konservierten Sequenzen (verschiedene Versionen wegen anderen Headern etc oder doppelten Clustern bei jedem der 4 Wege)

results2table.pl: Erstellt Tabellen mit den einzelnen Wahrscheinlichkeiten für Matrize und Organismus, insgesamt 6 verschiedene