Ergebnisse des Praktikums in der Graph Theorie

Reading and filtering the data

Als Programmiersprache haben wir JAVA gewält. Der Vorteil von JAVA ist die existenz zahlreicher Bibliotheken, die uns ermöglicht haben unsere Ergebnisse zu vergleichen. Um die Daten einzulesen wurde ein BufferedReader verwendet. Dazu haben wir verglichen ob die Nutzung eines CSV-Parser Vorteile bringt. Der verwendete Parser (openCSV) hat bei den relativ einfachen Dateien keine Vorteile gebracht.

Als Datenstruktur haben wir eine Adjazenzmatrix ausgewählt, da diese nötig ist für folgenden Aufgaben ist. Außerdem haben wir für die ersten Aufgaben, es auch mit einer Kantenliste probiert.

Verteilung der Knotengrade

Theta Mensch Schimpanse
0.05

Eigenvector centrality

Die Eigenvector Centrality habe wir erst mittels Apache.commons.Math package berechnet. Dieser Package konnte leider die Centrality nicht korrekt ermitteln.

Um die Eigenvector Centrality zu berechnen haben wir also die power iteration implementiert. Die power iteration beruht auf den Frobenius Theorem.

Distanzmatrix

Ausgehen von einer Adjazenzmatrix werden für jeden Knoten, die direkten Nachbarn nach allen Nachbarn und ihre Entfernung (ausser Knoten selbst) bis es keine Änderungen mehr gibt.

Graphvergleich mittels Zentratlitätswerten

Vorgehen

Zentralitäswert jeder Knoten wurde durch den Maximalen Wert geteilt, um Werte zwischen 0-1 zu kriegen. Und dann der Vektor eines Graphen den des anderen substrahiert.

Gene centrality

Gemeinsamkeit

p=0.05p=0.01
degree:90.34%85.85 %
eccentricity:85.90 %90.77 %
status:95.06 %87.60 %
centroid:89.88 %89.69 %
betweeness:95.27 %99.97 %
eigenvector:89.26 %85.46 %

Unterschiede

eccentricity:14.10 %09.23 %
status:4.94 %12.40 %
centroid:10.12 %10.31 %
betweeness:4.73 %0.03 %

Direkten Graphvergleich

comparison of complete graph

p=0.05

HumanChimpanzeeGemeinsamErgebnisse
nr of edges:16577716987214307374.2943046%
nr of vertices:704704704100%

Gemeinsam

p=0.05p=0.01
nr of edges:143073109819
nr of vertices:704704
similarity (edges):74.29 % 65.52 %
similarity (nodes):100 %100%

comparison of cores

p=0.05

MenschSchimpanseGemeinsamErgebnisse
k479480
nr of edges:1204081299689867865.04 %
nr of vertices:49151144579.89 %

p=0.01

MenschSchimpanseGemeinsamErgebniss
k426430
nr of edges:996111000677188256.25 %
nr of vertices:44744838073.79 %