Fortgeschrittene Methoden in der Bioinformatik (10-INF-BIO4)

Thema: Orthology, gene tree - species tree reconciliation

Best Match Graphs, Geiss et al

Themenübersicht der Vorlesungen

VLDatumRaumUhrzeitThema
VL 01Fr 13.04.18 R 109 14:00 Biologischer Hintergrund, Best Match Graphs
VL 02Mo 16.04.18 R 109 14:00 Supertrees, Aho ``Build''
VL 03Fr 20.04.18 R 109 14:15
VL 04Mo 23.04.18 R 109 14:00
VL 05Fr 27.04.18 R 109 14:15
VL 06Fr 04.05.18 R 109 14:15 Besprechung von Ahos' Build

Wichtig

ab 13.04.2018
  • Gruppen bis max. 3 Teilnehmer
  • freie Wahl der Programmiersprache pro Gruppe
  • dies ist kein Programmierkurs, sie sollten die Sprache der Wahl bereits beherrschen
ab 04.05.2018
  • Schicken sie eine Liste der Gruppenmitglieder (maximal 3!) an choener@ mit Subject "Fortgeschrittene Methoden SS18: Gruppe"
  • Kommentieren sie welche Codeteile von welcher Person implementiert wurden

Leistungskriterien

ab 13.04.2018
  • Pruefung
  • Erklaerung des Sourcecode (durch jedes Gruppenmitglied!)
  • numerische Resultate, ca. 3 Seiten Ergebnisse und Beschreibung
ab 16.04.2018
  • Implementation: Aho ``Build'' (bis 04.05.2018!)

Plan

ab 04.05.2018
  1. Aho als fingerubeung
  2. Generator fuer colored BMGs
    (random tree mit N nodes, colored in S colors)
  3. erst mal die connected 2-colored BMGs anschaen
    1. compute thinness classes & check the axioms (N1), (N2), (N3)
    2. if true, compute the R'(\alpha) and build the least resolved tree
    3. extract informative triples, run Aho
    4. check with this yields input tree again.
    5. compare results of both methods.
  4. dann die n-color version bauen
    1. combine connected components for each color pair
    2. Aho version for making the combined tree
    3. implement Fernandez-Baca algorithm and check whether it makes a difference
  5. have a look a real data

Literatur

  • M. Geiß et al. Best Match Graphs. arXiv:1803.10989v2
  • Y. Deng and D. Fernández-Baca. Fast Compatibility Testing for Rooted Phylogenetic Trees. 27th Annual Symposium on Combinatorial Pattern Matching (CPM 2016).
  • Jacob Holm, Kristian de Lichtenberg, and Mikkel Thorup. Poly-logarithmic deterministic fully-dynamic algorithms for connectivity, minimum spanning tree, 2-edge, and biconnectivity. J. ACM, 48(4):723-760 (2001).
  • R.M. Page. Modified mincut supertrees. @ semanticscholar.org
  • Wiki article Gomory-Hu tree
  • Proteinortho: Detection of (Co-)orthologs in large-scale analysis, Lechner et al, 2011
  • Daten

    Der ProteinOrtho Test-Datensatz findet sich hier
  • test.tar: ProteinOrtho Eingaben als fasta files; werden durch ProteinOrtho verarbeitet
  • test: Verzeichis von test.tar zum einfachen Anschauen
  • test.blast-graph: diese Datei enthaelt die paarweisen reciprocal best matches und soll gelesen werden
  • test.ffadj-graph: Variante mit "-synteny" Option: enthaelt zwei Spalten mehr und soll auch gelesen werden koennen
  • graph-description.md: Beschreibung des Formats der *graph Dateien
  • graph-description.pdf: Beschreibung des Formats der *graph Dateien als pdf
  • "Teaching" Variante von ProteinOrtho

    hier