Alexander Gross
Stefan Seemann
Wir untersuchten die Virusgruppe der Comoviridea. Diese Virusgruppe besitzt zwei getrennte RNA-Abschnitte, die seperat betrachtet werden müssen.
1. In der NCBI-Datenbank fanden wir folgende Arten, deren Genom vollständig sequenziert wurde:
RNA1AF394606 | 6006 | Bean pod mottle virus strain K-Hancock1 | Comovirus |
AF394608 | 5998 | Bean pod mottle virus strain K-Hopkins1 | Comovirus |
NC_003496 | 5995 | Bean pod mottle virus | Comovirus |
U70866 | 5995 | Bean pod mottle virus | Comovirus |
M83830 | 5957 | Cowpea severe mosaic virus | Comovirus |
NC_003545 | 5957 | Cowpea severa mosaic virus | Comovirus |
NC_003549 | 5889 | Cowpea mosaic virus | Comovirus |
NC_003741 | 6033 | Red clover mottle virus | Comovirus |
NC_003799 | 5865 | Squash mosaic virus | Comovirus |
NC_003693 | 7362 | Beet ringspot virus | Nepovirus |
NC_003509 | 7711 | Blackcurrant reversion virus | Nepovirus |
NC_003791 | 7471 | Cycas necrotic stunt virus | Nepovirus |
NC_003622 | 7212 | Grapevine chrome mosaic virus | Nepovirus |
NC_003615 | 7342 | Grapevine fanleaf virus | Nepovirus |
AF016626 | 7977 | Peach rosette mosaic virus | Nepovirus |
U50869 | 7514 | Tobacco ringspot virus | Nepovirus |
NC_004439 | 7358 | Tomato black ring virus | Nepovirus |
NC_003840 | 8214 | Tomato ringspot virus | Nepovirus |
NC_003003 | 5951 | Broad bean wilt virus | Fabavirus |
NC_003975 | 5957 | Patchouli mild mosaic virus | Fabavirus |
AF394607 | 3688 | Bean pod mottle virus strain K-Hancock1 | Comovirus |
AF394609 | 3688 | Bean pod mottle virus strain K-Hopkins1 | Comovirus |
NC_003495 | 3662 | Bean pod mottle virus | Comovirus |
NC_003544 | 3732 | Cowpea severe mosaic virus | Comovirus |
NC_003550 | 3481 | Cowpea mosaic virus | Comovirus |
NC_003738 | 3543 | Red clover mottle virus | Comovirus |
AF059532 | 3369 | Squash mosaic virus strain Arizona | Comovirus |
AF059533 | 3356 | Squash mosaic virus strain Kimble | Comovirus |
NC_003800 | 3354 | Squash mosaic virus | Comovirus |
AY017339 | 3820 | Arabis mosaic virus | Nepovirus |
NC_003694 | 4662 | Beet ringspot virus | Nepovirus |
NC_003502 | 6405 | Blackcurrant reversion virus | Nepovirus |
NC_003792 | 4669 | Cycas necrotic stunt virus | Nepovirus |
NC_003621 | 4441 | Grapevine chrome mosaic virus | Nepovirus |
NC_003623 | 3774 | Grapevine fanleaf virus | Nepovirus |
NC_004440 | 4633 | Tomato black ring virus | Nepovirus |
NC_003839 | 7273 | Tomato ringspot virus | Nepovirus |
NC_003004 | 3607 | Broad bean wilt virus | Fabavirus |
NC_003974 | 3591 | Patchouli mild mosaic virus | Fabavirus |
2. Loeschen der Kommentare zur weiteren Verarbeitung der Sequenzen
.
Verbinden der FASTA-Files fuer RNA1 und RNA2:
cat * >alles_[1|2].seq
3. Alignment fuer RNA1 und RNA2 mit clustalw:
clustalw alles_[1|2].seq >clustalw_output.txt
4. Umwandlung des Alignments in NEX-Format:
aln2nex.pl
Graphische Darstellung der Ähnlichkeit/Verwandtschaft in einem Baum mittels splitstree:
./splits alles_[1|2].nex
5. Analyse von tree.ps:
Der Baum stellt starke Verwandschaften innerhalb der Virusgruppen Comovirus, Nepovirus bzw. Fabavirus dar, aber kaum Verwandschaften zwischen den Gruppen.
Daher werden die Schritte 2. bis 4. einzeln für die drei Virusgruppen wiederholt.
6. Analyse von tree.ps und clustalw_output.txt:
Eliminierung von Sequenzen deren Alignment mit einer anderen Sequenz einen Score >90% erzeugt:
RNA1-Comovirus: NC_003496, U70866, M83830
RNA2-Comovirus: AF394609
Eliminierung von Sequenzen deren Alignment mit den anderen Sequenzen einen Score <30% erzeugt:
RNA1-Nepovirus: AF016626, NC_003509, NC_003615, U50869, NC_003840
RNA2-Nepovirus: AY017339, NC_003502, NC_003623, NC_003839.
Wiederholung der Schritte 2. bis 4. für die verbliebenen Sequenzen.
7. Vergleichsrechnung mit code2aln am Beispiel des Comovirus-Datensatzes brachte keine Verbesserung des Alignments, und wurde somit wieder verworfen.
8. Erzeugung von Vienna-Files (jede Sequenz auf einer Zeile) aus FASTA-Files mittels readseq:
readseq -a alles_[1|2].seq >alles_[1|2]_vienna.seq
9. Strukturvorhersage mit RNAfold:
./RNAfold -p
Als Ausgabe wird neben dem Single Alignment aller Sequenzen in rnafold_output.txt ein DotPlot für jede Sequenz als ps-File erstellt.
10. Gemeinsamer DotPlot für jeweils RNA1 und RNA2 aller Sequenzen einer Virusgruppe mittels Alidot, wobei die Alignments aus ClustalW und die ps-Files aus RNAfold als Eingabedaten dienen:
./alidot -p alles_[1|2].aln >alidot_output.pfrali
11. Suche nach relevanten Sequenzfragmenten in den gemeinsamen DotPlots mittels dem Viewer AliDot, die konservierte Strukturen darstellen könnten:
AliDot.pl alidot_output.pfrali
12. Ausschneiden der relevanten Sequenzfragmente:
consens.pl -f $1 -l $2 alles_[1|2].aln alidot_output.pfrali >[firstbasenumber]_[lastbasenumber].pfrali
13. Graphische Darstellung der Sekundärstrukturen mit RNAplot erzeugt ps-File:
RNAplot <[fbn]_[lbn].pfrali
Markierung konservierter Basenpaare in der graphischen Darstellung mit anote:
anote.pl alidot_output.pfrali [fbn]_[lbn]_ss.ps [fbn-1]
14. Graphische Darstellung der Alignments der Sequenzfragmente mit ClustalX in die Dateien [fbn]_[lbn].ps
15. Zoomen in das DotPlot zu den einzelnen Sequenzfragmenten mit AliDot:
dpzoom.pl -f $1 -l $2 alidot_output.ps >[fbn]_[lbn]_dp.ps