Erstellung eines Multiple AlignmentsFür die zu untersuchende Virusfamilie werden entsprechende Einträge in der NCBI-Datenbank zur Verfügung gestellt. Folgende Viren werden ausgewählt:
Zunächst wird mit dem Programm
clustalw das gemeinsame
Multiple Alignment der ausgewählten Sequenzen der Virusgattungen Comovirus,
Fabavirus und Nepovirus erstellt. Die Alignments werden getrennt für die
RNA-Typen 1 und 2 erstellt. Auswertung der VerwandschaftsbäumeComoviridaeVerwandtschaftsbäume stellen die evolutionären Distanzen zwischen verschiedenen Arten grafisch dar. Der auf Basis des ersten Multiple Alignment mit splitstree berechnete Verwandtschaftsbaum zeigt folgendes Ergebnis.
Hierfür musste zuerst das mit clustalw gewonnene Alignment mit dem Perl-Script aln2nex.pl in das NEX-Format konvertiert werden. Die Bäume stellen die Hamming-Distanzen der untersuchten Sequenzen dar. In beiden Abbildungen ist eine Aufteilung des Baumes in drei Segmente näherer Verwandtschaft der Viren zu erkennen. Jeder Bereich kann einer Virusgattung zugeordnet werden.
Die Eliminierung nah verwandter Virusarten erhöht die Differenzierbarkeit
einzelner Virenarten im Baum. Schranke der Eliminierung ist der Score des Alignments
der Viren-RNAs. Der Score kann als Verwandtschaftsgrad interpretiert werden.
Sequenzen, deren Score sich im Bereich zwischen 30% und 90%
bewegt bleiben erhalten. Gattung Comovirus
Gattung Fabavirus
Erwartungsgemäß ist eine Eliminierung bei nur zwei gefundenen Sequenzen der Gattung Fabavirus nicht sinnvoll. Ebenso sind konservierte Sekundärstrukturen bzw. kompensatorische Mutationen nicht zu erwarten. Deshalb wird die Gattung der Fabaviren im Folgenden nicht weiter betrachtet und von der Untersuchung ausgeschlossen. Gattung NepovirusBerechnung der SekundärstrukturMit dem Programm RNAfold als Teil des Vienna RNA Packages kann aus geeigneten Quelldaten die zu erwartende Sekundärstruktur von RNA-Strängen errechnet werden. Das Tool nutzt Sequenzdateien im Vienna-Format die mehrere Sequenzen umfassen, um die Berechnung durchzuführen. Als Ausgabedateien entstehen Dotplots (PostScript) für jedes RNA-Genom und jeweils ein Minimum-Free-Energy-File welches die energetischen Zustände in der Struktur beschreibt. Der Anteil der Dot-Bracket-Notation innerhalb der Datei beschreibt öffnende und schließende Basenpaare einer Struktur. Die o.g. Dateien können über die unten stehenden Links heruntergeladen werden. Gattung Comovirus
Gattung Nepovirus
Suche nach konservierten StrukturenAnschließend wird die Suche nach konservierten Strukturen durchgeführt. Konservierte Sekundärstrukturen werden trotz Mutationen innerhalb der Sequenz erhalten. D.h. wenn Basen mutieren, mutiert die jeweilig komplementäre Base ebenfalls. Somit kommt es wiederum zum Aufbau von Wasserstoffbrückenbindungen zwischen beiden Nucleotiden. Diese Bindung hat zur Folge, dass sich die gleiche Sekundärstruktur entfaltet. Zur Bewertung ist entscheidend, dass die Konservierung bei möglichst vielen Einzelsträngen (unterschiedlicher Viren) auftritt. Häufiger konservierte Strukturen weisen auf strukturell bedeutsame Teilstränge hin. Bei diesen Abschnitten ist nicht die Codierung der Sequenz entscheidend, sondern die räumliche Struktur, in der die Fragmente falten.Das Tool alidot ermöglicht in Zusammenarbeit mit dem Script anote.pl die Markierung der Sequenzabschnitte, die wahrscheinlich konservierte Sekundärstrukturen enthalten. Hierfür müssen zunächst die Dotplots der einzelnen Sequenzen zu einem gemeinsamen Dotplot verrechnet werden. Anhand des resultierenden Dotplots und der Visualisierungssoftware AliDot werden zu erwartende Sequenzbereiche visuell ausgewählt. Der Dotplot wird folgendermaßen interpretiert. Die markierten Sequenzabschnitte werden anschließend mit Hilfe des Tools extract.sh aus der Gesamtsequenz ausgeschnitten. Die Fragmente können entsprechend ihrer Mutationswahrscheinlichkeit innerhalb aller Sequenzen, die im Gesamt-Dotplot enthalten sind, markiert werden. Eine Auswahl der besten Ergebnisse sind unten dargestellt. Je dunkler dabei die Färbung der Kreise bzw. Nucleotide ist, desto höher ist die Wahrscheinlichkeit einer konservierten Sekundärstruktur. Zur Bewertung sind die genutzten Regionen des Dotplots ebenfalls abrufbar. Gattung Comovirus
Gattung Nepovirus
|