Die wichtigste Seite ist die des National Center for
Biotechnology Information (ncbi). Sämtliche von uns verwendete Dateien
(*.gbk,*.ptt,*.rnt usw.) haben wir von diesem ftp Server.
ftp://ftp.ncbi.nlm.nih.gov/genomes/Bacteria/
Die online-Enzyklopädie Wikipedia mit nützlichen allgemeinen
Informationen über Gammaproteobakterien.
www.wikipedia.org
Einordnung der Bakterien (verschiedene Quellen, da keine
eindeutige Klassifizierung existiert)
http://ijs.sgmjournals.org/content/vol55/issue5/images/large/IJE67349-2c.jpeg
http://ijs.sgmjournals.org/content/vol55/issue5/images/large/IJE67349-2a.jpeg
http://www.genetics.org/cgi/reprint/168/3/1639
http://ijs.sgmjournals.org/cgi/content/full/55/5/2013
http://pubmedcentral.org/articlerender.fcgi?artid=1175084&rendertype=figure&id=F3
Allgemeine Bakterieninformationen
Biologie Wissensspeicher,
Volk und Wissen Verlag GmbH
http://arep.med.harvard.edu/ecoli_matrices
dialign: multiples Alignmentprogramm
TF (C ): bildet
orthologe Cluster (gruppiert Operons in Cluster)
Footprinter: Sucht mit Hilfe
eines gegebenen phylogenetischen Stammbaumes stark konservierte Sequenzen
innerhalb des Stammbaumes und gibt diese grafisch aus
aln2pattern &
pwmatch : Matcht DNA oder RNA-Sequenzen gegen positionsgewichtete
Matrizen, um Wahrscheinlichkeiten des Vorkommens darin zu ermitteln
Skripte
proteinortho.pl : Finden von orthologe Genen
extract_XXX.pl : Aufgabe aller extract_XXX Skripte war es, die Intergensequenzen auszuschneiden (verschiedene Versionen wegen anderen Headern etc oder doppelten Clustern bei jedem der 4 Wege)
mAAna_tropy.pl ( dialign und anschließend maana_tropy zur weiteren Filterung der Daten)
extract_motifs : Extraktion der gefundenen konservierten Sequenzen vom Footprinter
collect_XXX : Verabeitung der mAAna_tropy/footprinter Ergebnisse und Zusammenfassen in eine Datei pro Organismus mit den konservierten Sequenzen (verschiedene Versionen wegen anderen Headern etc oder doppelten Clustern bei jedem der 4 Wege)
results2table.pl: Erstellt Tabellen mit den einzelnen Wahrscheinlichkeiten für Matrize und Organismus, insgesamt 6 verschiedene