Methoden

Ziel:

Anhand der snoStrip pipeline wurde innerhalb einer neuen D.plexippus Annotation die snoRNA Sequenzen bestimmt und nach eventuellen neuen snoRNA Gene gesucht. Anbei erfolgte eine Auswertung der gefunden snoRNA Gene.


Schritt 1: Finden der snoRNA-Gene aus der D.plexippus Annotation

Shell-Code:
grep 'snoRNA_gene' > snoRNA_gene.gff grep 'snoRNA' > snoRNA.gff

Eingangsdatei Ausgangsdatei Ausgangsdatei
D.plexippus Annotation snoRNA-Gene snoRNA-Transkript
gff-Datei gff-Datei gff-Datei



Schritt 2: Erstellen einer fasta-Datei anhand der gefundenen snoRNA Gene aus dem älteren Genoms von Danaus plexippus.

Shell-Code:
bedtools getfasta -fi Danaus_plexippus_DanPle.1.0.fa -bed snoRNA_gene -fo dpl1.fa -s

Eingangsdatei 1 Eingangsdatei 2 Ausgangsdatei
snoRNA-Gene dpl1 snoRNA-Gene-dpl1
gff-Datei fasta-Datei fasta-Datei



Start der snoStrip Annotations pipeline


Schritt 1 der snoStrip Annotations pipeline:

Schritt 3: Blasten der gefunden Sequenzen gegen die beiden Danaus plexippus Genome

Shell-Code (jeweils eine Zeile):
blastall -p blastn -d /scr/genomes/Metazoan-Animals/Danaus_plexippus/OTHER/daunaus_plexippus_supercontigs.fa -i dpl1.fa -m 8 -e 1e-10 > dpl3.blastout

blastall -p blastn -d /scr/genomes/Metazoan-Animals/Danaus_plexippus/ENSEMBL/Danaus_plexippus_DanPle.1.0.fa -i dpl1.fa -m 8 -e 1e-10 > dpl1.blastout

Eingangsdatei Eingangsdatei Ausgangsdatei
dpl1-Genom snoRNA Gene Blastout1
dpl3-Genom snoRNA Gene Blastout2
fasta Datei fasta Datei blastout Datei



Schritt 4: Umwandeln des Blastoutputs in bed-Dateien

Shell-Code (jeweils eine Zeile):
awk '{if($10>$9){print $2"\t"$9"\t"$10"\t"$1"\t"(($3*$4)/100)"\t-"}else{print $2"\t"$10"\t"$9"\t"$1"\t"(($3*$4)/100)"\t+"}}' dpl3.blastout > dpl3.bed

awk '{if($10>$9){print $2"\t"$9"\t"$10"\t"$1"\t"(($3*$4)/100)"\t-"}else{print $2"\t"$10"\t"$9"\t"$1"\t"(($3*$4)/100)"\t+"}}' dpl1.blastout > dpl1.bed

Eingangsdatei Ausgangsdatei
Blastout1 dpl1.bed
Blastout2 dpl3.bed
blastout Datei bed Datei



Schritt 5: Sortieren und Zusammenfügen der Datei dpl3.bed

Shell-Code:
sortBed -i dpl3.bed > dpl3_sort.bed

mergeBed -i dpl3_sort.bed > dpl3_sort_merge.bed

Eingangsdatei Ausgangsdatei
dpl3.bed dpl3_sortiert
dpl3_sort.bed dpl3_merged
blastout Datei bed Datei



Schritt 6: Herausfinden der überlappenden snoRNA Gene mit Bedtools Intersect

Shell-Code:
bedtools intersect -a D.plexippus.gff -b dpl3_sort_merge.bed -wao

bedtools intersect -a dpl3_sort_merge.bed -b D.plexippus.gff -wao


Bild 1: Darstellung der Vorgehensweise von bed intersect

Eingangsdatei Eingangsdatei Ausgangsdatei
D.plexippus dpl3_merged Vergleich 1
dpl3_merged D.plexippus Vergleich 2



Schritt 7: Anhand von Beispiel: Überlappen von Gen-ID in dpl1 und dpl3

Shell-Code (jeweils eine Zeile):
fastacmd -d /scr/genomes/Metazoan-Animals/Danaus_plexippus/OTHER/daunaus_plexippus_supercontigs.fa -s 'DPSCF300789' -S '2' -L '5457,5539'

fastacmd -d /scr/genomes/Metazoan-Animals/Danaus_plexippus/OTHER/daunaus_plexippus_supercontigs.fa -s 'DPSCF300789' -S '2' -L '5357,5639'

fastacmd -d /scr/genomes/Metazoan-Animals/Danaus_plexippus/OTHER/daunaus_plexippus_supercontigs.fa -s 'DPSCF300470' -S '2' -L '49963,50045'

fastacmd -d /scr/genomes/Metazoan-Animals/Danaus_plexippus/OTHER/daunaus_plexippus_supercontigs.fa -s 'DPSCF300470' -S '2' -L '49863,50145'

fastacmd -d /scr/genomes/Metazoan-Animals/Danaus_plexippus/ ENSEMBL/Danaus_plexippus_DanPle.1.0.fa -i dpl1.fa -s 'JH387043' -S '2' -L '5457,5539'

fastacmd -d /scr/genomes/Metazoan-Animals/Danaus_plexippus/ ENSEMBL/Danaus_plexippus_DanPle.1.0.fa -i dpl1.fa -s 'JH387043' -S '2' -L '5357,5639'

Ausgangsdatei
JH387043



Schritt 8: Sequenzalignment

Shell-Code:
muscle -in JH387043.fa -out JH387043.aln -clwstrict

Ausgangsdatei
JH387043 Alignment



Schritt 9: Umwandeln des clustal Alignment in Stockholm Datei

Shell-Code:
perl stockholm.pl JH387043.aln JH387043.aln.stk

Perl-Script Eingangsdatei Ausgangsdatei
Stockholm.pl JH387043.aln JH387043.aln.stk