Bioinformatik Praktikum Modul ProteinstrukturenAufgabenstellungZiel dieses Praktikums war die Vorhersage der Tertiärstruktur zweier Target Sequenzen aus dem Rahmen des CASP6 Projektes. Dazu sollte eine Struktur mit Hilfe von Comparative Modelling, das andere Target mittels Protein Fold Recognition modelliert werden Auswahl der TargetsWir haben die folgenden Sequenzen aus der Casp6 Target-List untersucht:
Suche nach homologen SequenzenZunächst haben wir in der NCBI - Datenbank mittels BLAST nach homologen Proteinen bezüglich der Primärstruktur gesucht. Für das Target T0258 brachte die Suche zwei gute Ergebnisse, von insgesamt elf Hits:
Die beiden Proteine wurden in der NCBI Datenbank gesucht und die entsprechenden *.pdb Files heruntergeladen. 1d4a NADHdh_2 NAD(P)H dehydrogenase [quinone] 1Für das Target T0214 wurden mittels Blast-Suche keine homologen Strukturen gefunden. Anschließend wurde nochmals mit Psi-Blast gesucht, welches ebenfalls nicht erfolgreich war. Um dennoch homologe Strukturen zu finden wurde mittels Fold Recognition nach selbigen gesucht. Fold RecognitionFür die Sequenz T0214 haben wir mit Hilfe der Tools 3DPSSM und 123D Protein Fold Recognition durchgeführt. Folgende Sequenzen mit einer ähnlichen Struktur beüglich unseren Targets haben wir zur weiteren Verwendung ausgewählt:
Die Sequenz 1FXK wurde von beiden Programmen als die strukturell "ähnlichste" Sequenz zu unserem Target gefunden. Secondary Structure PredictionMit Hilfe verschiedener Tools haben wir die Sekundärstruktur des Targets T0214 berechnen lassen:
Neben der Sekundärstruktur erhielten wir vom Predict Protein Server eine Reihe weiterer Informationen über unsere unbekannte Struktur. Die Sequenz wurde dafür an weitere Services gesendet, u.a. an ProSite zur Detektion von Motiven, sowie ProDom zur Erkennung von releventen Domänen. Die komplette Ausgabe kann hier eingesehen werden. Die drei gefundenen Motive weisen alle ein phosphorilierende Funktion auf. Eine Domäne wurde ebenfalls gefunden, allerdings mit einer Wahrscheinlichkeit von 51,9% was weitere Aussagen hinfällig machte. Homology ModellingIm folgendem wurde versucht mit Hilfe der homologen Sequenzen etwas über die Tertiärstruktur des Targets T0258 sagen zu können. Dazu wurde zunächst mit dem Web-Tool Fugue Alignments zwischen der Aminosäuresequenz des Targets und der Struktur des entsprechenden Templates erstellt. Als Eingabe verlangt das Tool die Aminosäuresequenz des Targets sowie die pdb-id eines entsprechenden Templates. Die Ausgabe lag dabei im *.pir Format vor. Um nun ein Modell der gesuchten Struktur zu erstellen, wurde das Tool Modeller7v7 benutzt. Als Eingabe wird die Alignment-Datei im *.pir Format erwartet, sowie die *.pdb- Datei des jeweiligen Templates. Die Eingabedateien, sowie weitere Optionen werden in einer Konfigurationsdatei model.top zusammengetragen. Die Ausgabe des Tools ist u.a. eine *.pdb Datei unseres Targets. Target T0258Die Erstellung der *.pdb Datei bzgl. der Templates 1T5B und 1d4a erfolgte problemlos: Leider war es uns nicht möglich, den Modeller auf das Alignment mit dem Template 1TIK A anzuwenden, es scheiterte an ungleichen Residuen. Daraufhin erstellten wir ein Alignment dieser Template-Sequenz mit unserem Target mittels ClustalW 1.82. Allerdings lief dies auf die gleiche Fehlermeldung hinaus. Wir entschlossen uns daher unsere TargetSequenz mit dem Swiss-Modeller weitgehend automatisch analysieren zu lassen. Erggebnis war eine Strukturdatei im *.pdb Format. Target T0214Bei der Verwendung des mit Fugue erstellten Alignments zwischen der Struktur der Sequenz 1FXK und dem Target machte uns der Modeller wieder auf die ungleichen Residuen aufmerksam. Daraufhin erstellten wir ein Alignment der Sequenzen mit Hilfe von ClustalW 1.82, mit welchem wir unsere Struktur modellieren konnten. Durch das Fugue-Alignment zwischen der Struktur des Templates 1H99 mit unserem Target war es uns möglich, mit Hilfe des Modellers, zu dem folgenden Resultat zu gelangen. Visualisierung der TertiärstrukturenDie Visualisierung erfolgte mit dem Tool VMD.
Überprüfung der StrukturenUm die Qualität der ermittelten Strukturen zu überprüfen wurden zwei weitere Tools verwendet. Zum einen ProFit, welches den mittleren quadratischen Fehler zwischen beiden Strukturen berechnet. Dabei gilt ein Wert < 10 als akzeptabel. Zum anderen Prosa, mit welchem es möglich ist, die Energiekurven über den Strukturen zu berechnen und zwischen Strukturen zu vergleichen. T0258
T0214
ProtoNetAm letzten Tag des Praktikums war es uns möglich mit Hilfe dieses Tools mehr über das Target T0214 zu erfahren. ![]() ProtoNet klassifiziert Proteinsequenzen indem es diese in hierarchische Cluster einordnet. Unser Target wurde in das Cluster 272813 eingeordnet (Ausgabe - Clustercard), welches aus 353 Proteinen bestand. Allerdings existierten nur von drei Proteinen die, Strukturinformationen enthaltenden, PDB-Files. P-112346 (SYR-LISMO) war das Protein mit der größten Übereinstimmung aus dem erwähnten Cluster, jedoch standen uns über dieses keine weitern Strukturinformationen zur weiteren Bearbeitung zur Verfügung. Allgemeine Informationen![]() Taxonomy![]() Das TeamFragen an Karsten Krug 8966860 und Lars Thielecke 8971765 |