Bioinformatisches Praktikum: Modul Proteinstrukturen |
|||||||||||||||||||||||||||||||||||||||||||||
Alexander Groß, >Gunnar Boldhaus | |||||||||||||||||||||||||||||||||||||||||||||
Schnellnavigation |
|||||||||||||||||||||||||||||||||||||||||||||
Einleitung | |||||||||||||||||||||||||||||||||||||||||||||
Ziel des Praktikums ist es, durch die Anwendung bioinformatischer Methoden Aussagen über die Struktur und Funktion von bislang nicht erforschten Proteinen zu erstellen. Dazu wurden im Rahmen des diesjährigen CASP6 Projekts (Critical Assessment of Techniques for Protein Structure Prediction) drei Proteine ausgewählt. Die Ergebnisse der Untersuchung sind nachfolgend dargestellt. |
|||||||||||||||||||||||||||||||||||||||||||||
Proteinsequenz | |||||||||||||||||||||||||||||||||||||||||||||
CASP6-Targets Folgende Proteinsequenzen mit bisher unbekannter Struktur werden untersucht.
Einführende Tests Zunächst werden die Sequenzen mit dem Tool DAS auf Transmembranregionen untersucht. Die anschließende Untersuchung auf Coiled coils unter Verwendung des COILS-Servers ermöglicht die Identifikation von superspiralisierten Regionen.
Bei keinem der untersuchten Proteine können Transmembranregionen nachgewiesen werden. Jedoch enthält jedes Protein wahrscheinlich eine superspiralisierte Struktur. Weitere Informationen zur Schlüsselfunktion von Coiled coils finden Sie hier. |
|||||||||||||||||||||||||||||||||||||||||||||
Datenbanksuche | |||||||||||||||||||||||||||||||||||||||||||||
Suche nach homologen Proteinen
Comparative protein structure modeling (oder Homology modeling) kann die 3D-Struktur eines gegebenen Proteins (Targets) voraussagen. Hierfür wird jedoch die bekannte Struktur eines Template-Proteins benötigt. Templates sind im Allgemeinen sog. homologe Proteine mit einer gewissen Ähnlichkeit zum Target. Mit Hilfe eines Sequenzalignments lassen sich derartige Proteine finden. Wir nutzen hierfür die Dienste BLAST und PSI-BLAST, die beide vom NCBI angeboten werden.
Aufgrund der Ergebnisse lassen sich die Target-Proteine wie folgt einteilen:
Um nähere Aussagen zur Struktur zu ermöglichen wird mit dem Protein der ersten Gruppe nachfolgend eine Fold Recognition durchgeführt. Bei Target-Proteinen mit Homologen wird dagegen das Verfahren Sequence against Structure Alignment mit FUGUE angewendet. Da BLAST für T0237 ein mit 114 AS jedoch relativ kurzes homologes Protein findet, wird die Sequenz ebenfalls der Fold Recognition unterzogen. |
|||||||||||||||||||||||||||||||||||||||||||||
Fold Recognition | |||||||||||||||||||||||||||||||||||||||||||||
Die Tools 3DPSSM und 123D+ werden mit der Bearbeitung der Target-Sequenz T0219 (ohne Homologe) und T0237 (kurzes Homologes) beauftragt. Folgendene Ergebnisse entstehen durch die Berechnung:
1MZF und 1HN6 sind Gegenstand der weiteren Betrachtungen. Nach dem Herunterladen der Strukturdateien (1MZF.pdb, 1HN6.PDB) kann das Sequence against Structure Alignment mit FUGUE durchgeführt werden. |
|||||||||||||||||||||||||||||||||||||||||||||
Secondary Structure Prediction | |||||||||||||||||||||||||||||||||||||||||||||
Die Beauftragung Server JPRED und PSIPRED mit der Bearbeitung der Targets ergab folgende Ergebnisse.
Beide JPRED-Consensus-Sequenzen (Zeile "jpred") zeigen, dass sich sowohl alpha-Helices als auf beta-Faltblätter ausbilden werden. Die Ergebnisse von Lupas (Zeilen "Lupas *") ergeben, dass die Strukturen keine Coiled coils enthalten. Das steht im Widerspruch zu den o.g. Ergebnissen des COILS-Servers. |
|||||||||||||||||||||||||||||||||||||||||||||
Sequence against Structure Alignment | |||||||||||||||||||||||||||||||||||||||||||||
Das Alignment der PDB-Dateien der homologen bzw. in der Struktur ähnlichen Proteine und der zugehörigen Target-Sequenzen wird mit Hilfe von FUGUE berechnet.
Die Alignments im PIR-Format sind als Input für das Programm MODELLER geeignet welches das Homology Modeling durchzuführt. |
|||||||||||||||||||||||||||||||||||||||||||||
Homology Modeling | |||||||||||||||||||||||||||||||||||||||||||||
Das Homology Modeling kann mit verschiedenen Tools durchgeführt werden. Hier wurden MODELLER und SWISS-MODEL verwendet, um die nachfolgend abgebildeten Modelle zu berechnen. Das Tool VMD ermöglicht die visuelle Darstellung der resultierenden PDB-Dateien. T0219
T0237
T0270
Die berechneten Modelle werden anschließend auf Ihre Qualität hin untersucht. |
|||||||||||||||||||||||||||||||||||||||||||||
Modellverifikation | |||||||||||||||||||||||||||||||||||||||||||||
Prosa Die Nutzung des Tools Prosa erlaubt die Bestimmung der Stabilität von Proteinen. Prosa erstellt eine Ansicht der intramolekularen Kräfte eines Proteins in Form eines Energiegraphen, wobei geringe Energiewerte stabile Strukture charakterisieren. Der grüne Graph stellt das Template-Protein dar, der blaue Graph zeigt den Energiewert des berechneten Modells.
ProFit ProFit berechnet den mittleren Abstand aller Residuen zweier Proteine. Ein kleiner Abstand zeigt dabei, dass das Modell geeignet aus der Vorlage erstellt wurde.
Fazit Es ist erkennbar, dass nicht alle Modelle gut zu den Templates passen. Die RMS-Werte der zwei letzten Tabelleneinträge weisen entweder auf fehlerhafte Berechnungen hin, oder die Targets passen sehr gut zu den Templates. |
|||||||||||||||||||||||||||||||||||||||||||||
Proteinfunktion | |||||||||||||||||||||||||||||||||||||||||||||
Abschließende Nachforschungen zu den Funktionen der Targets ergaben folgende Ergebnisse:
|
|||||||||||||||||||||||||||||||||||||||||||||
Weitere Informationsquellen | |||||||||||||||||||||||||||||||||||||||||||||
Bei der Recherche nach Informationen im Rahmen des Praktikums sind einige zusätzliche Informationsquellen akquiriert worden. Robetta Server Der Robetta-Server fasst die oben beschriebenen, manuell durchzuführenden Schritte in einem einzigen Tool zusammen. Die vollautomatische Verarbeitung ermöglicht das zeitsparende Verarbeiten von Proteinen. Die ausgewählten Targets wurden bereits durch das Projekt bearbeitet. Ergebnisse: T0219, T0237 und T0270 BOINC/Predictor@home Im Rahmen des BOINC-Projektes (Berkeley Open Infrastructure for Network Computing) wurde das Predictor@home-Projekt ins Leben gerufen. Das Vorhaben hat sich zum Ziel gesetzt, die Struktur von CASP-Proteine durch den Einsatz verteilter und unabhängiger Rechner aufzulösen. Gegenwärtig liegen bereits Ergebnisse zum Target T0219 vor. Ein Klick auf die Thumbnails öffnet das im VRML-Format gespeicherte Modell.
|