Um zu untersuchen, wie sich die Anzahl der moeglichen Strukturen zur
Basenpaarlaenge verhaelt, wurde ein weiteres Programm geschrieben. In
dieses wurde die folgende theoretische Ueberlegung implementiert:
Anzahl der sich nicht kreuzenden Strukturen mit Laenge m (mindestens aber 3)
(7)
(8)
(9)
Da mit dieser Rekursion sehr grosse Zahlen addiert und multipliziert werden, musste die Rekursion mit einer Skalierung versehen werden:
Skalierungskonstante
(10)
(11)
(12)
(13)
(14)
Dazu musste nun die Summe der Strukturen zu einer spezifischen Distanz berechnet werden.
Basenpaare mit Laenge in einer Sequenz der Laenge m
(15)
(16)
(17)
Fuer den Fall
ist eine Sonderregel fuer die Summe notwendig:
(18)
Nach der Implementierung wurden mit dieser Rekursion fuer verschieden lange Sequenzen die theoretische maximal moegliche Anzahl an Strukturen mit bestimmten Basenpaardistanzen berechnet.
Figure 8:
Relative Distanzen und die maximal theoretisch moeglichen Strukturen
Bei der Analyse dieser Graphen stellte sich heraus, dass alle fuer
alle Sequenzen der Verlauf der Kurve sehr aehnlich ist, so
unterscheiden sie sich im wesentlichen durch die Anzahl der Strukturen
mit der Distanz 4. Durch die Verdopplung der Sequenzlaenge geht eine
quadratische Vergroesserung der Strukturen in diesem Bereich einher.
Zusaetzlich wurde noch untersucht, wie stark sich die Graphen an bestimmt Marken auf der X-Achse, sprich der relativen Distanz, unterscheiden.
Dazu wurde ein Intervallplot angelegt, welcher fuer alle Graphen einen
bestimmten Werte darstellt.
Figure 9:
Intervallplot fuer alle Graphen an den Marken 25, 50, 75 und 100