Bioinformatik Praktikum Modul Proteinstrukturen


Inhalt Tools
Aufgabenstellung
Auswahl der Targets
Suche nach Homologen Sequenzen
Fold Recognition
Secondary Structure Pediction
Homologie Modelling
Visualisierung der Tertiärstrukturen
Überprüfung der Strukturen
ProtoNet
Das Team
Protein Datenbank NCBI
PredictProtein
nnPredict
DSC
Fugue
3dpssm
SwissModel 123
VMD
Modeller
Prosa II



Aufgabenstellung

Ziel dieses Praktikums war die Vorhersage der Tertiärstruktur zweier Target Sequenzen aus dem Rahmen des CASP6 Projektes. Dazu sollte eine Struktur mit Hilfe von Comparative Modelling, das andere Target mittels Protein Fold Recognition modelliert werden



Auswahl der Targets

Wir haben die folgenden Sequenzen aus der Casp6 Target-List untersucht:

Target

Name

Nres

Methode

Beschreibung

T0214 Q8U3L1 110 NMR Hypothetical protein, P. furiosus
T0258 NP_460601 201 X-ray acyl carrier protein phosphodiesterase,
S. typhimurium LT2



Suche nach homologen Sequenzen

Zunächst haben wir in der NCBI - Datenbank mittels BLAST nach homologen Proteinen bezüglich der Primärstruktur gesucht. Für das Target T0258 brachte die Suche zwei gute Ergebnisse, von insgesamt elf Hits:

1T5B B:
Score = 373 bits (957), Expect = e-104
Identities = 190/201 (94%), Positives = 190/201 (94%)
Crystal Structure of a Protein from Salmonella Typhimurium
Similar to E. Coli Acyl Carrier Protein Phosphodiesterase
1TIK A:
Score = 334 bits (857), Expect = 5e-93
Identities = 163/201 (81%), Positives = 178/201 (88%)
Acyl Carrier Protein Phosphodiesterase des Bakteriums E.coli

Die beiden Proteine wurden in der NCBI Datenbank gesucht und die entsprechenden *.pdb Files heruntergeladen.
Eine weitere Möglichkeit homologe Strukturen zu finden bietet das Fugue-Search Tool, welches entsprechend den Substitution-Tables und Struktur-abhängigen Gap-Penalities in einer Fold-Library sucht. Die Ausgabe brachte eine weitere homologe Sequenz:

1d4a NADHdh_2 NAD(P)H dehydrogenase [quinone] 1

Für das Target T0214 wurden mittels Blast-Suche keine homologen Strukturen gefunden. Anschließend wurde nochmals mit Psi-Blast gesucht, welches ebenfalls nicht erfolgreich war. Um dennoch homologe Strukturen zu finden wurde mittels Fold Recognition nach selbigen gesucht.



Fold Recognition

Für die Sequenz T0214 haben wir mit Hilfe der Tools 3DPSSM und 123D Protein Fold Recognition durchgeführt. Folgende Sequenzen mit einer ähnlichen Struktur beüglich unseren Targets haben wir zur weiteren Verwendung ausgewählt:

1fxk:
Structure of the Molecular Chaperone Prefoldin:
Unique Interaction of Multiple Coiled Coil Tentacles with Unfolded Proteins Cell
1h99:
Crystal Structure of an Activated Form of the Pts
Regulation Domain from the Lict Transcriptional Antitrminator

Die Sequenz 1FXK wurde von beiden Programmen als die strukturell "ähnlichste" Sequenz zu unserem Target gefunden.



Secondary Structure Prediction

Mit Hilfe verschiedener Tools haben wir die Sekundärstruktur des Targets T0214 berechnen lassen:

Tab1: Vergleich der vorhergesagten Sekundärstrukturen folgender Tools:
DSC-King & Sternberg, Predict Protein Server, 3DPSSM, NNPredict
DSC CCEEECCCCCHHHHHHHCCEEEEEECCCCCCCCCCCCCEEEECCC
EEEEEEEEEECCHHHHHHHHHCCCCCCCCCCCCHHHHHHHHHHCC
CCHHHCCCCEEEEEEEECCC
Predict Protein CCCCCCCCCHHHHHHHCCCCEEEEEEHHHHHCCCCCCCEEEECCC
EEEEEEEEEEEECCHHHHHHHCCCCCCCCCCCCHHHHHHHHHHHC
CHHHHEECCEEEEEEEEECC
3D PSSM CCCCCCHHHHHHHHHHHHHHHHCCCCCHHHHHCCCCCCEEEECCC
EEEEEEEEEECCHHHHHHHHHCCHHHCCCCCCHHHHHHHHHHHHC
CHHHHHHCCEEEEEEEEECC
NNPredict CCCHHHHHHHHHHHHHHCCCCCCCHHHCHHCCCCCCCCCEECCCC
CCEEEEEEEEEHHCHHHHHHCCCCCCCCCCCCCCCHHHHHHHHHH
CCCCCCCCCEEEEECCCCCC

Neben der Sekundärstruktur erhielten wir vom Predict Protein Server eine Reihe weiterer Informationen über unsere unbekannte Struktur. Die Sequenz wurde dafür an weitere Services gesendet, u.a. an ProSite zur Detektion von Motiven, sowie ProDom zur Erkennung von releventen Domänen. Die komplette Ausgabe kann hier eingesehen werden. Die drei gefundenen Motive weisen alle ein phosphorilierende Funktion auf. Eine Domäne wurde ebenfalls gefunden, allerdings mit einer Wahrscheinlichkeit von 51,9% was weitere Aussagen hinfällig machte.



Homology Modelling

Im folgendem wurde versucht mit Hilfe der homologen Sequenzen etwas über die Tertiärstruktur des Targets T0258 sagen zu können. Dazu wurde zunächst mit dem Web-Tool Fugue Alignments zwischen der Aminosäuresequenz des Targets und der Struktur des entsprechenden Templates erstellt. Als Eingabe verlangt das Tool die Aminosäuresequenz des Targets sowie die pdb-id eines entsprechenden Templates. Die Ausgabe lag dabei im *.pir Format vor. Um nun ein Modell der gesuchten Struktur zu erstellen, wurde das Tool Modeller7v7 benutzt. Als Eingabe wird die Alignment-Datei im *.pir Format erwartet, sowie die *.pdb- Datei des jeweiligen Templates. Die Eingabedateien, sowie weitere Optionen werden in einer Konfigurationsdatei model.top zusammengetragen. Die Ausgabe des Tools ist u.a. eine *.pdb Datei unseres Targets.

Target T0258

Die Erstellung der *.pdb Datei bzgl. der Templates 1T5B und 1d4a erfolgte problemlos:

Leider war es uns nicht möglich, den Modeller auf das Alignment mit dem Template 1TIK A anzuwenden, es scheiterte an ungleichen Residuen. Daraufhin erstellten wir ein Alignment dieser Template-Sequenz mit unserem Target mittels ClustalW 1.82. Allerdings lief dies auf die gleiche Fehlermeldung hinaus. Wir entschlossen uns daher unsere TargetSequenz mit dem Swiss-Modeller weitgehend automatisch analysieren zu lassen. Erggebnis war eine Strukturdatei im *.pdb Format.

Target T0214

Bei der Verwendung des mit Fugue erstellten Alignments zwischen der Struktur der Sequenz 1FXK und dem Target machte uns der Modeller wieder auf die ungleichen Residuen aufmerksam. Daraufhin erstellten wir ein Alignment der Sequenzen mit Hilfe von ClustalW 1.82, mit welchem wir unsere Struktur modellieren konnten.

Durch das Fugue-Alignment zwischen der Struktur des Templates 1H99 mit unserem Target war es uns möglich, mit Hilfe des Modellers, zu dem folgenden Resultat zu gelangen.



Visualisierung der Tertiärstrukturen

Die Visualisierung erfolgte mit dem Tool VMD.

Tertiärstrukturen des Target T0258

1T5B_T0258

1T5B vs T0258
Tertiärstruktur des Targets T0258 erzeugt
durch die 1T5B Vorlage
Übereinandergelegte Tertiärstrukturen
der Homologen und Template Sequenz

NADH_T0258

NADH vs T0258
Tertiärstruktur des Targets T0258 erzeugt
durch die NADH Vorlage
Übereinandergelegte Tertiärstrukturen
der Homologen und Template Sequenz

1TIKA_T0258

1TIKA vs T0258
Tertiärstruktur des Targets T0258 erzeugt
durch die 1TIK A Vorlage
Übereinandergelegte Tertiärstrukturen
der Homologen und Template Sequenz


Tertiärstrukturen des Target T0214

1FXK_T0214

1FXK vs T0258
Tertiärstruktur des Targets T0258 erzeugt
durch die 1FXK Vorlage
Übereinandergelegte Tertiärstrukturen
der Homologen und Template Sequenz

1H99_T0258

1H99 vs T0258
Tertiärstruktur des Targets T0258 erzeugt
durch die 1H99 Vorlage
Übereinandergelegte Tertiärstrukturen
der Homologen und Template Sequenz


Überprüfung der Strukturen

Um die Qualität der ermittelten Strukturen zu überprüfen wurden zwei weitere Tools verwendet. Zum einen ProFit, welches den mittleren quadratischen Fehler zwischen beiden Strukturen berechnet. Dabei gilt ein Wert < 10 als akzeptabel. Zum anderen Prosa, mit welchem es möglich ist, die Energiekurven über den Strukturen zu berechnen und zwischen Strukturen zu vergleichen.

T0258

1tika (swiss) fehlender RMS-Wert, da die Ausgabe mit dem Tool "SWISS-MODEL" erzeugt wurde Grafik_1TIKA
1t5b ProFit: RMS = 0.835 Grafik_1T5B
1d4a RMS = 2.426 Grafik_NADH

T0214

1fxk ProFit: RMS = 23.169 Grafik_1FXK
1h99 ProFit: RMS = 3.426 Grafik_1H99


ProtoNet

Am letzten Tag des Praktikums war es uns möglich mit Hilfe dieses Tools mehr über das Target T0214 zu erfahren.

Cluster 272813

ProtoNet klassifiziert Proteinsequenzen indem es diese in hierarchische Cluster einordnet.

Unser Target wurde in das Cluster 272813 eingeordnet (Ausgabe - Clustercard), welches aus 353 Proteinen bestand. Allerdings existierten nur von drei Proteinen die, Strukturinformationen enthaltenden, PDB-Files.

P-112346 (SYR-LISMO) war das Protein mit der größten Übereinstimmung aus dem erwähnten Cluster, jedoch standen uns über dieses keine weitern Strukturinformationen zur weiteren Bearbeitung zur Verfügung.



Allgemeine Informationen

General Info

Taxonomy

Taxonomy


Das Team

Fragen an Karsten Krug 8966860 und Lars Thielecke 8971765