Durchführung
Step 0 - Proteinauswahl
Zu Beginn wählten wir zwei Aminosäuresequenzen aus der
CASP6-Liste aus.
Wir entschieden uns für:
Tar-Id |
Proteinbezeichnung |
Beschreibung |
T0257 |
AAG03475 |
Conserved hypothetical protein, P. aeruginosa PAO1 |
T0276
| 1wkc |
Conserved hypothetical protein, T. thermophilus |
Step 1 - Suche nach homologen Proteinen
Die spätere Vorhersage einer Tertiärstruktur, für die ausgesuchten Proteinen,
beruht auf der Annahme, dass ähnliche Primärstrukturen auch ähnliche Tertiärstrukturen ausbilden.
Aus diesem Grund galt es nun, zu den ausgesuchten Proteinen, Proteine mit einer möglichst ähnlichen
Aminosäuresequenz zu finden.
Bei der Ermittlung homologer Proteine hatten wir mehrere Möglichkeiten, hielten uns aber an eine feste
Abarbeitungsreihenfolge: Eine genau Beschreibung der allgemeinen Vorgehensweise ist
hier zu finden.
Folgende Schritte unternahmen wir, um Proteinhomologien zu erkennen:
- Suche nach konservierten Domänen mittels rpsblast.
- Auswerten der Treffer einer normalen Protein-Protein Suche mittels blastp.
Eine signifikante Häufung bestimmter Organismengruppen lässt unter Umständen
Rückschlüsse auf Homologien zu.
- Praktischerweise ermittelte auch FUGUE Proteinhomologien direkt.
- Wir versuchten unser Glück mit Superfamily.
- Eine letzte Möglichkeit ergab sich durch ProtoNet.
Zielprotein |
pdb-Code | homologes Protein | Proteinklasse |
gefunden durch |
T0257 |
1ugi | Uracil-DNA Glycosylase Inhibitor Protein | Glycosylase Inhibitor |
Superfamily |
T0276
| 1sou | 5,10-Methenyltetrahydrofolate Synthetase | Ligase |
FUGUE |
Step 2 - Tertiärstruktursuche
Von den in Step 1 ermittelten homologen Proteinen galt es nun die Tertiärstruktur zu finden.
Dies sollte sich als ungewohnt schwierig erweisen, denn es standen nicht immer unmittelbare Download-Links
zur Verfügung. Oft mussten wir uns durch grosse Linkfarmen hangeln, um letzlich doch mit leeren Händen
da zu stehen. Die verwendeten Datenbanken lassen sich in der
Link-Sektion dieses Protokolls
finden. Die Tertiärstrukturinformationen sind in pdb-Dateien (Protein-Data-Base-Dateien) gespeichert.
|
Anmerkung:
Wir verwendeten zwei verschiedenen Versionen von pdb-Dateien.
Die pdb-Dateien der Einzelmodell reprästentieren sind allerdings nur Auszüge aus den 20er-Modellsammlungen.
|
Step 3 - Alignment der Primärstrukturen
Für die Tertiärstrukturvorhersage der gewählten Proteine ist ein Alignment zwischen Target-Sequenz
und homologem Protein nötig
Das Sequenzalignment wurde mit dem Web-Interface
FUGUE durchgeführt.
Wir verwendeten ein Alignment im pir-Format.
Step 4 - Vorhersage der Tertiärstruktur
In diesem Schritt erfolgt die eigendliche Berechnung der Tertiärstruktur des Zielproteins.
Hierzu wurde das Programm
Modeller benutzt. Dieses Programm berechnete uns eine mögliche
Tertiärstruktur aus der Strukturinformation von homolgem Protein und dem Alignment von Target und Homologem.
Step 5 - grafische Darstellung der Tertiärstruktur
Die in Step 4 erzeugten Tertiärstruktur-Vorhersagen lassen sich nun grafisch veranschaulichen.
Diese grafische Darstellung der räumlichen Struktur des Moleküls erfolgte mit dem 3D-Modelierungsprogramm
VMD (Visual Molecular Dynamics).
Das Programm visualisiert Moleküle an Hand der Strukturinformationen der zugehörigen pdb-Datei.
Die einzeknen Ergebnisbilder dieses Programmes findet man im Ergebnisbereich dieses Protokolls.
Step 6 - RMS-Wert-Berechnung
Ein weiterer wichtiger Schritt war es nun, die in Step 4 erzeugte Tertiärstruktur auf ihre Gültigkeit
zu überprüfen.
Hierzu hinterfragten wir die Wahrscheinlichkeit der vorhergesagten Struktur, die sich im sogenannten RMS-Wert
wiederspiegelte. Dieser gibt den mittleren Abstand zwischen zwei Molekülen an.
Unter Abstand ist die unterschiedliche Lage der einzelnen Abschnitte des Moleküls im Raum zu verstehen.
Die Einheit, in der dieser Wert angegeben wird, ist Anström.
Um den RMS-Wert zu berechnen wurde das Programm
ProFit verwendet.
ProFit benötigt
zwei pdb-Datein für die beiden zu vergleichenden Tertiärstrukturen und das passende Sequenzalignment der
Ausgangsproteine. Im Programm mussten eine Reihe von Befehlen eingegeben werden. Sinnvollerweise lagerten wir diese
in folgendes Skript aus:
- REFERENCE <homologes Protein>.pdb
- MOBILE <Zielprotein>.pdb
- READALIGNMENT <Alignment>.ali
- IGNOREMISSING
- FIT
- RMS
- WRITE <neuer Bezeichner>.pdb
ProFit berechnete uns RMS-Werte und zugleich eine neue pdb-Datei für das Zielprotein.
Die räumliche Lage des Targets wurde durch das Programm an die des homologen Proteins angepasst, so dass
ein Vergleich leichter möglich ist.
Step 7 - Berechnung der Energiekurve des Moleküls
Der zweite Schritt, der die erzeugte Tertiärstruktur testet, ist das Erzeugen einer Energiekurve des Moleküls.
Diese Kurve wurde mit dem Programm
Prosa erzeugt. Prosa erwartete folgende Eingaben:
- read pdb <homologes Protein>.<homologes Protein>
- read pdb <Zielprotein>.pdb <Zielprotein>
- analyse energy *
- color * <homologes Protein> <Farbe>
- color * <Zielprotein> <Farbe>
- color back <Farbe>
- color axis <Farbe>
- color title <Farbe>
- winsize *25
- pscolor = 1
- plot
- export plot Name
Wir erhielten zwei Energiekurven im post-script Format, einzusehen in der Ergebnissektion dieses Protokolls.
Step 8 - Protokoll
Der letzte Schritt des Praktikums war die Erstellung einer geeigneten Dokumentation über alle abgelaufenen Vorgänge.
Damit das Protokoll einfach zugänglich ist, und von so vielen Personen wie möglich ohne zusätzlichen
Software-Aufwand zu betrachten ist, verfassten wir diese Webseiten. Das Ergebnis sehen sie nun vor sich.