Home

Einführung

Durchführung

Ergebnisse

Quellen

English

Ergebnisse

1. Chrakteristik des Datensatzes
2. Annotation mit Datenbanken, RNAmicro und tRNAScan
3. Cluster-Analyse auf Sequenzebene
4. Cluster-Analyse hinsichtlich der Sekundaerstruktur
5. Manuelle Annotation der Ergebnissen der Clusteranalyse
6. Sekundärstrukturen

1. Chrakteristik des Datensatzes



Locus-Laengen

Die Haeufung der bei 120 ist mit der Windowslaenge von eben diesem Wert zu erklaeren.

P-value fuer die Originaldaten und den zufaellig erzeugten





Im Originaldatensatz werden sehr viele Kandidaten mit hoher Signifikanz gefunden, waehrend im zufaellig erzeugten zum einen insgesamt weniger als ncRNA eingestuft werden und ausserdem werden den gefunden Kandidaten geringere Signifikanzen zugewiesen.

SCI und z-score im Vergleich mit den zufaellig erzeugten Daten




blau: Orginial-loci
rot: zufaellig gemischten loci

Loci mit einem z-Score mit einem unter -3 und einem SCI-Werte nahe 1 gelten als gute ncRNA-Kandidaten. Unter den Orginalloci erfuellen sichtbar mehr loci die Anforderungen.

False-Positive-Rate


False-Positive-Rate = 268/1392 = 0.1925

Erwartungsgemaess faellt die FPRate einigemassen gering aus, was darauf hindeutet, dass RNAz relativ gut trainiert ist und aus einem in Rahmen zufaellig erzeugten Datensatz erheblich weniger ncRNAs vorhersagt.

2. Annotation mit Datenbanken, RNAmicro und tRNAScan

Der Vergleich mit den Datenbanken ergab folgende Ergebnisse:

noncode 3 hits
Rfam 120 hits
miRBase 9 hits
ncRNAdb 27 hits
tRNAScan 110 hits
RNAmicro 305 hits
gesamt annotiert: 426
Anzahl aller loci: 1392
nicht-annotierte mit p-wert > .9: 724
nicht-annotierte mit p-wert > .99: 459

Uebersicht ueber alle Loci und Windows einschliesslich der Annotationen

3. Clusteranalyse auf Sequenzebene

1. Cluster-size:63; Anotated:58; RNAmicro:58;
2. Cluster-size:32; Anotated:31; RNAmicro:31;
3. Cluster-size:26; Anotated:17; RNAmicro:17;
4. Cluster-size:25; Anotated:0;
5. Cluster-size:24; Anotated:0;
6. Cluster-size:21; Anotated:17; RNAmicro:17;
7. Cluster-size:21; Anotated:2; RNAmicro:2;
8. Cluster-size:21; Anotated:18; RNAmicro:18;
9. Cluster-size:21; Anotated:1; RNAmicro:1;
10. Cluster-size:19; Anotated:0;
11. Cluster-size:18; Anotated:2; RNAmicro:2;
12. Cluster-size:17; Anotated:0;
13. Cluster-size:14; Anotated:0;
14. Cluster-size:13; Anotated:7; RNAmicro:7;
15. Cluster-size:13; Anotated:8; RNAmicro:8;
16. Cluster-size:12; Anotated:2; RNAmicro:2;
17. Cluster-size:12; Anotated:0;
18. Cluster-size:12; Anotated:12; Rfam:12;tRNAScan:12;
19. Cluster-size:11; Anotated:0;
20. Cluster-size:11; Anotated:11; Rfam:11;tRNAScan:11;
...

Verteilung der Loci selbst, sowie der fuenf groessten Cluster im untersuchten Genomabschnitt

1: Cluster Nr. 1 (s.o.)
2: Cluster Nr. 2 (s.o.)
3: Cluster Nr. 3 (s.o.)
4: Cluster Nr. 4 (s.o.)
5: Cluster Nr. 5 (s.o.)
6: alle Kandidaten (1392 loci)

Deutlich wird mit diese Grafik, dass sich im Allgemeinen die RNAz-Kandidaten eher im vorderen Bereich des Genoms befinden und somit auch in diesem Bereich viele Cluster sich bilden koennen.

5. Manuelle Annotation der Ergebnissen der Clusteranalyse

Locus Annotation S-Score e-Value
locus1315 Non-LTR Retrotransposon 216 e-53
locus138 Non-LTR Retrotransposon 218 e-54
locus39 Non-LTR Retrotransposon 222 e-55
Fugu T-cell-receptor 50 0.002
locus437 Non-LTR Retrotransposon 222 e-55
Fugu T-cell-receptor 50 0.001
locus1002 Fugu T-cell-receptor 234 e-59
Non-LTR Retrotransposon 46 0.03
locus676 Fugu T-cell-receptor 224 e-56
Non-LTR Retrotransposon 54 e-04

6. Sekundärstrukturen

Mikro-RNA

t-RNA