Praktikum-Modul 2: "Community Structures in biologischen Netzwerken"

Durchführung.

Arbeitsschritte:
• Datenaufbereitung
• Ausgangsdatei: seegras.txt

• Eliminiere Duplikate - doppelten Genotypen in und zwischen Wiesen

• Identifiziere potentiell verwandte Organismen

• Alle 14 Allele der 7 Loci des (Kind) Organismus müssen durch Kombination der Elternpaar-Allele erzeugbar sein

• Jedes "Elternteil" ist dann möglicher Verwandtschaftskandidat

• Input-Output-Graph
• Jede Wiese bildet einen Knoten

• Es existiert eine Kante zwischen Wiese A und Wiese B, wenn es mindestens einen Organismus innerhalb Wiese A gibt, der potentielles "Elternteil" von einem Organismus aus Wiese B sein kann oder umgekehrt

• Zähle für alle Organismen, wie oft sie selber "Elternteil" sind (Output-Ausgehende Kanten)

• Zähle für alle Organismen, wie oft sie "Kind" sind (Input-Eingehende Kanten)

• Erzeuge ungerichteten Graphen
• Kantengewicht zwischen zwei Wiesen entspricht Summe der ein- und ausgehenden Kanten zwischen diesen Wiesen
• Normierter ungerichteter Graph
• Kantengewicht zwischen zwei Wiesen entspricht Summe der ein- und ausgehenden Kanten zwischen diesen Wiesen normiert mit der Gesamtanzahl aller Kanten der Wiese
• Matrix
• betrachtet den Austausch zwischen den einzelnen Wiesen

• Zähle wie oft "Kinder" in einer bestimmten Wiese1 "Elternteile" aus einer bestimmten Wiese2 haben

• normiert als "Kinder" (Input) aus Wiese1 durch "Kinder" (Input) aus der Wiese insgesamt

• Suche Cluster / Community Structures
"Chinese Whispers"

• Graph

• Matrix

• Analyse
Maria Herberg
Stephanie Kehr