Aus den Informationen der blast Suche werden die Sequenzen mit dem Tool fastacmd
aus den Genom des jeweiligen Organismus kopiert.
fastacmd -d <db .file> -s <Pos_spez> -L start,end -s 1,2
Der -s Parameter spezifiziert die Position der Sequenz über ein Label näher. Die 1 bei -s bezeichnet einen Forward Strang, die -2 Reverse. Für jede miRNA wurde eine Fasta Datei erstellt. Das fasta Label ist wie folgt:
>XXYY[-rs]ZZ.start-end
Dabei bezeichnen die Platzhalter: XX - Kürzel des Organismus, YY - Chromosomnummer, [-rs] - nichts, random oder scaffold, ZZ - Nummer der miRNA, Start und Ende der Sequenz.