Durchführung |
Durchfuehrung1. Beschaffenheit der Datengrundlage 2. Chrakteristik des Datensatzes 3. Annotation mit Datenbanken 4. Annotation von microRNA und tRNA Cluster-Analyse auf Sequenzebene 5. Cluster-Analyse hinsichtlich der Sekundaerstruktur 6. Manuelle Annotation der Ergebnissen der Clusteranalyse 1. Beschaffenheit der DatengrundlageIn folgenden Formen lagen die uns zur Verfuegung stehenden Daten vor: Ergebnissdatei des
RNAz-Programm-Package (rnazClusters.dat): Fugu-Sequenzen im
Fasta-Format (Fugu.ncRNAs.05.fa): 2. Chrakteristik des DatensatzesMit Perlskripten oder
einfachen Bash-Tools ermittelten wir aus der RNAz-Ergebnisdatei
(rnazClusters.dat) die benoetigten Werte, wie Laenge, p-Value
(Signifikanz des Ergebnisses/locus), SCI-Value (Mass fuer
die Konservierung der Sekundaerstruktur der einzelnen windows),
z-score (Mass fuer die Stabilitaet der Sekundaerstruktur der
einzelnen windows) und analysierten diese (u.a. mit xmgrace
zur grafischen Darstellung). 3. Annotation mit DatenbankenMit Hilfe des Programm
rnazBlast.pl (Basic local alignment search tool) verglichen
wir unsere ncRNA-Kandidaten mit diversen Datenbanken: Dazu
bereiteten wir die Datenbankdateien (im Fasta-Format) mit formatdb
-p F -i [db] -o zur weiteren Verarbeitung vor, ehe wir
rnazBlast.pl darauf anwandten und schrieb das Ergebnis
direkt in die rnazCluster.dat. Zur Ermittlung von
microRNA- und tRNA-Kandidaten standen uns die Programme RNAmico
und tRNAScan zur Verfuergung. Waehrend RNAmicro als
Eingabe die Alignments benoetigt, nutzt tRNAScan die Daten
im Fasta-Format (Fugu.ncRNAs.05.fa). Beide Programme
lieferten die entsprechenden loci-Listen, welche wir schliesslich
durch rnazAnnotate.pl mit unserer Ergebnisdatei
(rnazClusters.dat) kombinierten und damit die Information
eintrugen. 4. Clusteranalyse auf SequenzebeneEs wurden alle loci mit dem Programm blastclust bezueglich Sequenzhomologien zusammengefasst/geclustert. Hierauf untersuchten und analysierten wir die Eigenschaften der einzelnen Cluster. 5. Clusteranalyse hinsichtlich der SekundaerstrukturLediglich die loci mit einem p-value von ueber .99 (Performance) dienten dem Programm LocARNA-Cluster-Pipeline-1.0 zur Eingabe. 6. Manuelle Annotation der Ergebnisse der Cluster-AnalyseHierzu waehlten wir den groessten, nicht annotierten Cluster (kein locus des Cluster ist annotiert) aus und suchten nach Sequenzhomologien in anderen Spezies (NCBI). |
|
|
||
|
||
|
||
|
||
|
||
|
||
|
||