Bioinformatisches Praktikum:
Modul Proteinstrukturen |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Einleitung |
Auf einen Blick → Einleitung → Protein Sequences → Database Searching → Fold Recognition → Secondary Structure Prediction → Sequence against Sructure Alignment → Homology Modelling → Modelltests → Vergleich/Analyse |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Die 3-dimensionale (oder Tertiär-) Struktur von Proteinen enthält die wesentlichen Informationen, um deren biologische Funktionen zu erkennen.
Weiterhin ist sie der Schlüssel zu biotechnologischem Arbeiten mit Proteinen und Arzneimitteldesign. Unser Ziel ist es, bisher unbekannte Strukturen einiger Proteine mit Hilfe des Homology Modelling vorherzusagen. Das CASP Projekt (critical assessment of techniques for protein structure prediction) beschäftigt sich mit den Methoden und Effizienz der verschiedenen Vorhersagetechniken. Auf den Projektseiten gibt es eine Liste mit Zielsequenzen verschiedener Proteine. Davon wählten wir 6 Targets aus, um deren Struktur zu modellieren. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Protein Sequence | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
CASP Targets
Sequence TestsSind unsere Targetproteine Transmembranproteine, bzw. enthalten sie möglicherweise transmembrane Segmente?Um diese vorherzusagen, benutzen wir die beiden Programme TMHMM (TMHMM Server v. 2.0. Prediction of transmembrane helices in proteins) und DAS (Dense Alignment Surface method; transmembran prediction server).
Bei keinem unserer Proteine haben beide Server transmembrane Regionen hinreichend nachweisen können. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Database Searching | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Um homologe Proteine zu unseren Targets zu finden haben wir eine BLAST-Suche (Sequenzalignment)
in der NCBI
Datenbank durchgeführt. Mit Hilfe der Ergebnisse dieser Suche lassen sich unsere
Targetproteine in 2 Gruppen aufteilen:
Der nächste Schritt für Gruppe I ist ein Sequence against Sructure Alignment mit FUGUE. Für Gruppe II wird als nächstes die Fold Recognition durchgeführt. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Fold Recognition | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Mit den Target-Sequenzen von unseren Proteinen für die keine homologen in der DB gefunden
wurden haben wir die Protein fold recognition mit Hilfe von
3DPSSM und
123D
durchgeführt. Wir erhielten die folgenden Proteine mit ähnlicher Struktur:
Nach diesen Proteinen haben wir dann in der PDB-DB gesucht um die zugehörige Strukturdatei zu erhalten. Mit dieser und unserer Target-Sequenz haben wir dann mit FUGUE ein Sequence against Sructure Alignment durchgeführt. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Secondary Structure Prediction | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Mit Hilfe des Predict Protein server's
haben wir versucht die Sekundärstruktur unserer Proteine vorhersagen zu lassen.
Der Server hat unsere Targetsequenzen an die folgenden Services weitergeschickt:
nnpredict, predpro, prof, psipred, scratch und sam-t99. Für die Sequenz des Proteins T0133 haben wir aus den einzelnen Ergebnissen eine Consensus-Sequenz abgeleitet: Die Ergebnisse sind sich bei allen Programmen einigermaßen ähnlich. Es ließ sich folgendes ableiten:
Die Klassen unserer Targets entsprechen auch den Klassen der Proteine, die 123D und 3DPSSM gefunden haben. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sequence against Sructure Alignment | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Die .pdb-Dateien der homologen bzw. in der Struktur ähnlichen Proteine und die
zugehörigen Target-Sequenzen haben wir mit Hilfe von
FUGUE
aligned. T0133 → 1eyh | 1hf8 | 1hg5 | 1hx8Diese Alignments haben wir im .pir-Format gespeichert und als Eingabe für den MODELLER verwendet, um das Homology Modelling durchzuführen. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Homology Modelling | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Mit den .pir Dateien, die wir durch Threading mit FUGUE erhalten
haben, und den Strukturdateien führten wir das Homology Modelling durch,
um 3D Modelle unserer Proteine zu erhalten. Dazu verwendeten wir das Programm
MODELLER.Sequenzhomologe aus der PDBT0143
T0158
T0164
Proteine der Fold RecognitionT0133T0160
T0192
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Modelltests | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
ProFitProFit berechnet den mittleren Abstand aller Residuen für zwei gegebene Protein Strukturen. Je kleiner der Abstand ist, desto besser passt das Modell an die Vorlage.
Ein guter mittlerer Abstand liegt bei ca 2Å. Unsere Werte sind so hoch, weil wir dem ProFit nur die beiden Struktur Dateien und nicht zusätzlich das Alignment der Aminosäuren eingegeben haben. Die in der Tabelle angegeben Werte sind deshalb nicht aussagekräftig. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Vergleich/Analyse | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Man kann erkennen, dass die Tertiärstrukturen unserer Modelle sehr gut auf die jeweiligen homologen bzw. durch Fold Recognition erhaltenen Proteine passen. Bei der Analyse mit ProSA, erkennt man jedoch, dass die Modelle der Proteine, die mittels Fold Recognition gebaut wurden, nicht ganz so stabil sind, wie die Vorlagen. Auffällig ist, dass die Strukturen der Targets von verschiedenen Vorlage Proteinen sich nicht sehr ähnlich sind. Nun ist die Frage, welches entspricht nun dem wirklichen Aussehen unseres Proteins....? |