Home

Einführung

Durchführung

Ergebnisse

Quellen

English

Durchfuehrung


1. Beschaffenheit der Datengrundlage
2. Chrakteristik des Datensatzes
3. Annotation mit Datenbanken
4. Annotation von microRNA und tRNA
Cluster-Analyse auf Sequenzebene
5. Cluster-Analyse hinsichtlich der Sekundaerstruktur
6. Manuelle Annotation der Ergebnissen der Clusteranalyse


1. Beschaffenheit der Datengrundlage

In folgenden Formen lagen die uns zur Verfuegung stehenden Daten vor:

Ergebnissdatei des RNAz-Programm-Package (rnazClusters.dat):
Eine Liste aller loci (Kandidaten) und der zugehoerigen windows einschliesslich zusaetzlicher Informationen.
Da fuer die Verarbeitung der Sequenzen aus Gruenden der Performance die Sequenzen eine bestimmte Laenge nicht ueberschreiten sollten, wurden diese vor der Bewertung durch RNAz auf weitestgehende einheitliche Groessen geschnitten (
windows). Mit rnazCluster des Vienna-RNAz-Packages wurden die aussichtsreichsten Kandidaten, welche sich an entsprechenden Stellen ueberlappen, einem locus zusammengefasst.

Fugu-Sequenzen im Fasta-Format (Fugu.ncRNAs.05.fa):
Liste aller loci-Sequenzen und Bezeichnung.



2. Chrakteristik des Datensatzes

Mit Perlskripten oder einfachen Bash-Tools ermittelten wir aus der RNAz-Ergebnisdatei (rnazClusters.dat) die benoetigten Werte, wie Laenge, p-Value (Signifikanz des Ergebnisses/locus), SCI-Value (Mass fuer die Konservierung der Sekundaerstruktur der einzelnen windows), z-score (Mass fuer die Stabilitaet der Sekundaerstruktur der einzelnen windows) und analysierten diese (u.a. mit xmgrace zur grafischen Darstellung).

Um zeigen, dass die die RNAz-Ergebnisse nicht zufaelliger Natur sind, erzeugten wir unter Beibehaltung bestimmter Merkmale einen zufaellig Sequenzsatz auf der Basis der Ausgangsalignments (rnazRandom.pl). Auf diese wandten wir erneut zRNA.pl und rnazCluster.pl an und verglichen dieses Ergebnis mit den Originaldaten.




3. Annotation mit Datenbanken


Mit Hilfe des Programm rnazBlast.pl (Basic local alignment search tool) verglichen wir unsere ncRNA-Kandidaten mit diversen Datenbanken:
- noncode
- miRBase
- Rfam
- ncRNAdb


Dazu bereiteten wir die Datenbankdateien (im Fasta-Format) mit formatdb -p F -i [db] -o zur weiteren Verarbeitung vor, ehe wir rnazBlast.pl darauf anwandten und schrieb das Ergebnis direkt in die rnazCluster.dat.



Zur Ermittlung von microRNA- und tRNA-Kandidaten standen uns die Programme RNAmico und tRNAScan zur Verfuergung. Waehrend RNAmicro als Eingabe die Alignments benoetigt, nutzt tRNAScan die Daten im Fasta-Format (Fugu.ncRNAs.05.fa). Beide Programme lieferten die entsprechenden loci-Listen, welche wir schliesslich durch rnazAnnotate.pl mit unserer Ergebnisdatei (rnazClusters.dat) kombinierten und damit die Information eintrugen.


4. Clusteranalyse auf Sequenzebene

Es wurden alle loci mit dem Programm blastclust bezueglich Sequenzhomologien zusammengefasst/geclustert. Hierauf untersuchten und analysierten wir die Eigenschaften der einzelnen Cluster.



5. Clusteranalyse hinsichtlich der Sekundaerstruktur

Lediglich die loci mit einem p-value von ueber .99 (Performance) dienten dem Programm LocARNA-Cluster-Pipeline-1.0 zur Eingabe.



6. Manuelle Annotation der Ergebnisse der Cluster-Analyse


Hierzu waehlten wir den groessten, nicht annotierten Cluster (kein locus des Cluster ist annotiert) aus und suchten nach Sequenzhomologien in anderen Spezies (NCBI).