Übersicht der Arbeitsschritte zur Untersuchung der Sequenz T0134 Schritt 1) Alignmentsuche in Datenbank Schritt 2) Fold-Recognation Schritt 3) PDB-Datenbank Schritt 4) FUGUE Alignment Schritt 5) Modeller erzeugt 3D-Model Schritt 6) Ermittlung der Aussagekraft des erstellten Modells Schritt 7) Energievergleich mit Originalprotein Schritt 8) Vergleich der Fold-Recognation-Tools Sequenzdaten
Schritt 1) Alignmentsuche in einer Proteindatenbank Schritt 2) Fold-Recognation
Im diesem Schritt wird erneut nach einem homologen Protein gesucht. Die Auswertung
des Tools FUGUE ergibt gleich zwei moegliche homologe Proteine fuer unsere
Sequenz. Ihr PDB-Code ist 1qts und 1e42.
Schritt 3) PDB-Datenbank Anhand des PDB-Codes kann fuer diese beiden Proteine jeweils das pdb-File heruntergeladen werden, welches das 3D-Modell dieser beiden homologen Proteine enthaelt. Diese Files werden im Folgenden benoetigt, um aus unserer Sequenz ein dreidimensionales Modell erstellen zu koennen. Struktur-Modell von 1qts ![]() Struktur-Modell von 1e42 ![]() zur Übersicht Schritt 4) FUGUE Alignment
Auf der FUGUE-Seite wird nun ein Alignmnet-Tool verwendet, welches unsere
Ausgangssequenz mit den beiden 3D-Strukturfiles der homologen Proteine alignt.
Dabei entsteht ein .pir-File (align_1qts_T0134.pir), welches ebenfalls der
3D-Modellerzeugung dient. Der Inhalt des .pir-Files ist im Folgenden dargestellt:
>P1;1qts structureX:1qts GSPGIRLGSSEDNFARFVCKNNGVLFENQL--LQIGLKSEFRQ-NLGRMFIFYGNKTSTQFLNFTPTLIC ADDLQTNLNLQTK-------PVDPTVDGG--AQVQQVVNIECI---SDFTEAPVLNIQFRYGGTFQNVSV KLPITLNKFFQPTEMASQDFFQRWKQLSNPQQEVQNIFKAKHPMDTEITKAKIIGFGS-ALLEEVDPNPA NFVGAGIIHTKTTQIGCLLRLEPNLQAQMYRLTLRTSKDTVSQRLCELLSEQF---* >P1;4542 Sequence: 4542 GEPVQNGAPEEEQLPP--ESSYSLLAENSYVKMTCDIRGSLQEDSQVTVAIVLENRSSSILKGMELSVL- -DSLNARMARPQGSSVHDGVPVPFQLPPGVSNEAQYVFTIQSIVMAQKLKGTLSFIAKNDEGATHEKLDF RLHFSCSSYLITTPCYSDAFAKL---LESGDLSMSSIKVDGIRMSFQNLLAKICFHHHFSVVERVD---- ---SCASMYSRSIQ-GHHVCLLVKKGENSVSVDGKCSDSTLLSNLLEEMKATLAKC* >P1;1e42 structureX:1e42: 705 :A: 937 :A: : : : GYV---APKAVWLPAVKAKGLEISGTFTHR----------QGHIYMEMNFTNKALQHMTDFAIQFNKNS -------FGVIPSTPLAIHTPLMPNQSIDVSLPLNTLGPVMKMEPLNNLQVAVKNNIDVFYFSCLIPLNV LFVE---DGKMERQVFLATWKDIPNENELQFQIKECHLNADTVSSKLQNNNVYTIAKRNVEGQDMLYQSL KLTNGIWILAELRIQPGNPNYTLSLKCRAPEVSQYIYQVYDSILKN* >P1;T0134 sequence EPVQNGAPEEEQLPPESSYSLLAENSYVKMTCDIRGSLQEDSQVTVAIVLENRSSSILKGMELSVLDSL NARMARPQGSSVHDGVPVPFQLPPGVSNEAQYVFTIQSIVMAQKLKGTLSFIAKNDEGATHEKLDFRLHF SCSSYLITTPCYSDAFAKLLES-GDLSMSSIKVDGIRMSFQNLLAKICFHHHFSVVERVDSCASMYSRSI QGHH-----VCLLVKKGENSVSVDGKCSDSTLLSNLLEEMKATLAK* Schritt 5) Modeller erzeugt 3D-Model
Im Modeller wird nun anhand des soeben erzeugten .pir-Files und der .pdb-Struktur
jeweils eines der beiden homologen Proteine ein dreidimensionales Modell
unserer Ausgangsstruktur erzeugt.
Dieses Modell ist mit dem Tool vmd zu betrachten.
Schritt 6) Ermittlung der Aussagekraft des erstellten Modells
Mit Hilfe des Tools "profit" wird aus dem erstellten Modell, sowie aus dem
jeweiligen 3D-Modell der homologen Proteine der RMS-Wert berechnet. Das ermoeglicht
uns zwischen den beiden anfangs ermittelten homologen Proteinen und den daraus
erstellten 3D-Modellen unserer Sequenz das aussagekräftigere Modell ausfindig zu machen.
Ergebnis: Vergleich der modeller.pdb mit naehester_struktur.pdb [profit] 1qts: RMS = 11.74 > 10 Modell nicht verwendbar da schlechte Vorhersage 1e42: RMS = 10.17 = 10 Modell verwendbar (Zone fuer t0134 1-233) Das aus dem Protein mit dem PDB-Code 1e42 gewonnene 3D-Modell ist mit einem RMS-Wert von fast 10 ein brauchbares Modell und wird deshalb als Ergebnis des Auswertungsprozesses angesehen. Schritt 7) Energievergleich mit Originalprotein Das Programm Prosa erstellt eine Ansicht der innermolekularen Kräfte
eines Proteins. So kann das erzeugte Model ein weiteres Mal auf seine Aussagekraft
hin untersucht werden. Im Folgenden dargestellt ist das Prosa-Ergebnis, in dem die
untere energieärmere Kurve unser Model, die obere Kurve das homologe Protein darstellt.
Aufgrundder RMS-Werte haben wir diesen Schritt nur für das aussagekräftige Protein 1e42
durchgeführt. Neben FUGUE existieren noch weitere Tools, die es ermoeglichen eine Fold-Recognation durchzufuehren. Wir haben uns entschieden fuer dieses Beispiel die moeglichen Ergebnisse dieser anderen Tools zu Vergleichszwecken zu ermitteln und die naechsten Sequenzen T0142-T0166 mit dem Tool weiter zu bearbeiten, welches uns hier das beste Ergebnis liefert. Tool 2) 123D_foldrec. bester Kandidat mit Z-score=5.96: 1e0ta weiterer Weg wie oben, Vergleich der modeller.pdb mit 1e0ta.pdb [profit] -> RMS = 14.829 > 10 kein besseres Modell gefunden -> zur Auswertung Tool 3) 3dpssm_foldrec bester kandidat ist 1b9k mit e-value: 0,173 schlechterer RMS-Wert 18,706 als bei foldrec durch fugue ergo bleiben wir bei unserer ergebnislage -> zur Auswertung Tool 4) Swiss modeller Ergebnis: "The degree of similarity of your sequence with proteins of known 3D structure may be to low."
Das beste Ergebnis mit einem RMS-Wert von 10,17 lieferte uns FUGUE. Dieses Tool
wird uns also weiter begleiten. Als Fazit lässt sich festhalten, dass wir ein
einigermassen annehmbares 3D-Modell für unsere Sequenz auf diesem Weg erzeugen konnten.
Das gibt Hoffnung für die Zukunft.
|