Alexander Gross
Stefan Seemann

Wir untersuchten die Virusgruppe der Comoviridea. Diese Virusgruppe besitzt zwei getrennte RNA-Abschnitte, die seperat betrachtet werden müssen.

1. In der NCBI-Datenbank fanden wir folgende Arten, deren Genom vollständig sequenziert wurde:

RNA1
AF3946066006Bean pod mottle virus strain K-Hancock1Comovirus
AF3946085998Bean pod mottle virus strain K-Hopkins1Comovirus
NC_0034965995Bean pod mottle virusComovirus
U70866 5995Bean pod mottle virusComovirus
M83830 5957Cowpea severe mosaic virusComovirus
NC_0035455957Cowpea severa mosaic virusComovirus
NC_0035495889Cowpea mosaic virusComovirus
NC_0037416033Red clover mottle virusComovirus
NC_0037995865Squash mosaic virusComovirus
NC_0036937362Beet ringspot virusNepovirus
NC_0035097711Blackcurrant reversion virusNepovirus
NC_0037917471Cycas necrotic stunt virusNepovirus
NC_0036227212Grapevine chrome mosaic virusNepovirus
NC_0036157342Grapevine fanleaf virusNepovirus
AF0166267977Peach rosette mosaic virusNepovirus
U50869 7514Tobacco ringspot virusNepovirus
NC_0044397358Tomato black ring virusNepovirus
NC_0038408214Tomato ringspot virusNepovirus
NC_0030035951Broad bean wilt virusFabavirus
NC_0039755957Patchouli mild mosaic virusFabavirus

RNA2
AF3946073688Bean pod mottle virus strain K-Hancock1Comovirus
AF3946093688Bean pod mottle virus strain K-Hopkins1Comovirus
NC_0034953662Bean pod mottle virusComovirus
NC_0035443732Cowpea severe mosaic virusComovirus
NC_0035503481Cowpea mosaic virusComovirus
NC_0037383543Red clover mottle virusComovirus
AF0595323369Squash mosaic virus strain ArizonaComovirus
AF0595333356Squash mosaic virus strain KimbleComovirus
NC_0038003354Squash mosaic virusComovirus
AY0173393820Arabis mosaic virusNepovirus
NC_0036944662Beet ringspot virusNepovirus
NC_0035026405Blackcurrant reversion virusNepovirus
NC_0037924669Cycas necrotic stunt virusNepovirus
NC_0036214441Grapevine chrome mosaic virusNepovirus
NC_0036233774Grapevine fanleaf virusNepovirus
NC_0044404633Tomato black ring virusNepovirus
NC_0038397273Tomato ringspot virusNepovirus
NC_0030043607Broad bean wilt virusFabavirus
NC_0039743591Patchouli mild mosaic virusFabavirus

Datenbankeinträge im FASTA-Format gespeichert

2. Loeschen der Kommentare zur weiteren Verarbeitung der Sequenzen .
Verbinden der FASTA-Files fuer RNA1 und RNA2:
cat * >alles_[1|2].seq

3. Alignment fuer RNA1 und RNA2 mit clustalw:
clustalw alles_[1|2].seq >clustalw_output.txt

4. Umwandlung des Alignments in NEX-Format:
aln2nex.pl alles_[1|2].nex
Graphische Darstellung der Ähnlichkeit/Verwandtschaft in einem Baum mittels splitstree:
./splits alles_[1|2].nex

5. Analyse von tree.ps:
Der Baum stellt starke Verwandschaften innerhalb der Virusgruppen Comovirus, Nepovirus bzw. Fabavirus dar, aber kaum Verwandschaften zwischen den Gruppen. Daher werden die Schritte 2. bis 4. einzeln für die drei Virusgruppen wiederholt.

6. Analyse von tree.ps und clustalw_output.txt:
Eliminierung von Sequenzen deren Alignment mit einer anderen Sequenz einen Score >90% erzeugt:
RNA1-Comovirus: NC_003496, U70866, M83830
RNA2-Comovirus: AF394609
Eliminierung von Sequenzen deren Alignment mit den anderen Sequenzen einen Score <30% erzeugt:
RNA1-Nepovirus: AF016626, NC_003509, NC_003615, U50869, NC_003840
RNA2-Nepovirus: AY017339, NC_003502, NC_003623, NC_003839.
Wiederholung der Schritte 2. bis 4. für die verbliebenen Sequenzen.

7. Vergleichsrechnung mit code2aln am Beispiel des Comovirus-Datensatzes brachte keine Verbesserung des Alignments, und wurde somit wieder verworfen.

8. Erzeugung von Vienna-Files (jede Sequenz auf einer Zeile) aus FASTA-Files mittels readseq:
readseq -a alles_[1|2].seq >alles_[1|2]_vienna.seq

9. Strukturvorhersage mit RNAfold:
./RNAfold -p rnafold_output.txt &
Als Ausgabe wird neben dem Single Alignment aller Sequenzen in rnafold_output.txt ein DotPlot für jede Sequenz als ps-File erstellt.

10. Gemeinsamer DotPlot für jeweils RNA1 und RNA2 aller Sequenzen einer Virusgruppe mittels Alidot, wobei die Alignments aus ClustalW und die ps-Files aus RNAfold als Eingabedaten dienen:
./alidot -p alles_[1|2].aln >alidot_output.pfrali

11. Suche nach relevanten Sequenzfragmenten in den gemeinsamen DotPlots mittels dem Viewer AliDot, die konservierte Strukturen darstellen könnten:
AliDot.pl alidot_output.pfrali

12. Ausschneiden der relevanten Sequenzfragmente:
consens.pl -f $1 -l $2 alles_[1|2].aln alidot_output.pfrali >[firstbasenumber]_[lastbasenumber].pfrali

13. Graphische Darstellung der Sekundärstrukturen mit RNAplot erzeugt ps-File:
RNAplot <[fbn]_[lbn].pfrali
Markierung konservierter Basenpaare in der graphischen Darstellung mit anote:
anote.pl alidot_output.pfrali [fbn]_[lbn]_ss.ps [fbn-1]

14. Graphische Darstellung der Alignments der Sequenzfragmente mit ClustalX in die Dateien [fbn]_[lbn].ps

15. Zoomen in das DotPlot zu den einzelnen Sequenzfragmenten mit AliDot:
dpzoom.pl -f $1 -l $2 alidot_output.ps >[fbn]_[lbn]_dp.ps

Zurück zur Startseite