Durch den Vergleich mit den Proteinsequenzen von Hox-Genen anderer Organismen versuchten wir, die fehlenden Hox-Cluster B, C und D im Genom zu lokalisieren. Die dazu verwendeten Sequenzen sind im Anhang aufgelistet.
Vor der Suche wurde mit formatdb und einem Hilfsskript fdb.sh (Aufruf im Verzeichnis der *.fa) eine Datenbank über dem Genom erstellt.
Mit tblastn
(Protein query vs. translated database) wurden ausreichend gute Aligments (evalue = 0.000001 oder besser) gesucht. Per tblastn1.sh-Skript erhielten wir für jeden Vergleich eines Proteins mit einem Chromsom eine Ergebnisdatei.
Die Ergebnisdateien wurden nach den Spezies zusammengefaßt, mit rename.pl
bearbeitet, so dass die Tabelleneinträge eindeutig sind. Die in einer Datei weiter zusammengefassten Hits (cat *.rename >all.rename
) wurden mit sorthits.pl all.rename >all.sort
sortiert und anschließend mehrfache Einträge entfernt.