Bioinformatik Praktikum


Strukturvorhersage von Proteinen



November 3, 2004


Inhalt


Einleitung

Proteine bestehen aus Aminosäuren. Man kann sie als Primär-, Sekundär-, Tertiär- oder Quartärstruktur beschreiben.

Die Primärstruktur erhält man durch biologisch-technische Verfahren. Sie beschreibt lediglich die Abfolge der Aminosäuren.

In der Natur sind Proteine alles andere als ein ''Perlenkette''. Sie sind hochkomplex gefaltet. Einfache Interaktionen zwischen nicht benachbarten Aminosäuren finden sich in Sekundärstrukturen wie $ \beta$-Faltblatt oder $ \alpha$-Helix wieder. In der Tertiärstruktur finden weitere Interaktionen zwischen einzelnen Aminosäuren statt.

Die Erforschung der dreidimensionalen Struktur hat in der Biologie eine sehr große Bedeutung für ein tiefgründiges Verständnis der molekularen Vorgänge.

Um die natürlich vorkommenden Strukturen zu erforschen haben Biologen sich der NMR-Technik oder der der Röntgenstrahlung bedient. Jedoch schon für ein kleineres Molekül benötigt man bis zu einem Jahr für die Erforschung der dreidimensionalen Struktur.

Algorithmen zur Berechnung der in der Natur vorkommenden Strukturen haben somit eine enorme Wichtigkeit für die Wissenschaftler von heute.

Im folgenden soll gezeigt werden, wie man mit Hilfe von Computern, Programmen und Algorithmen innerhalb eines Tages vorhersagen für die dreidimensionale Struktur schaffen kann. Desweiteren soll mit einem Vergleich demonstriert werden, wie korrekt die verschiedenen Programme arbeiten.

Zielsetzung dieser Arbeit

Mit dieser Arbeit sollen anhand von zwei Proteinen folgende Ziele bearbeitet werden:

  1. Vorstellen der verschiedenen Programme/Server, Ergebnisse, Vergleich
  2. Lokalisation einer funktionalen Einheit

Server und Programme zur Vorhersage von 3D-Strukturen

Es gibt einige schnelle aber statische Varianten (A), dann einige mäßigschnelle aber doch bis zu einem gewissen Grad beeinflussbare Varianten (B) und dann noch die vollständig per Hand konstruierte Modelle. Letztere werden hier aus Zeitgründen und mangels Geräten ausgeschlossen.

Wir befassen uns in diesem Teil der Arbeit mit dem Protein HR1958 des Menschen, welches wir unter der Nummer T0211 von CASP6 erhalten haben.

Schnelle, sterische Varianten

Auf der Seite der CASP SERVER sind alle Server dargestellt, die ohne menschliche Einflüsse die 3D-Struktur der Proteine vorhergesagt haben. Ausgewählte Beispiele findet man hier.

Beeinflussbare Varianten

Ein weiterer Weg der Modellierung führt, wenn vorhanden, über homologe schon existierende 3D-Strukturen oder, falls nicht vorhanden, über verschiedene Programme die im folgenden vorgestellt werden.

Zur besseren Übersicht dient das FlowChart.

Membranintegrierende Strukturen

Die strukturelle Vorhersage von Proteinen kann idealerweise nur ohne weitere Einflüsse und Wechselwirkung mit der Umgebung geschehen. Wenn unser Protein also ein membranintegrierenden Teil besitzt, sind Strukturvorhersagen nicht absolut.

Im folgenden sind verschiedene Programme und deren Ergebnisse erläutert:

Server innerhalb Membran?
TMAP ja
PredictProtein nein
TMHMM nein
DAS ja

Suche nach Homologien in der PDB

Mit Hilfe von BLAST haben wir nach Homologen gesucht. Es gibt keinen Eintrag in der PDB für Homologe deren 3D-Strukturen bekannt ist.

Vorhersage der Sekundärstruktur

Mit Hilfe des PredictProtein haben wir eine Sekundärstrukturvorhersage unseres Proteins machen lassen.

Fold Recognition

Unserem Protein, zu dem noch keine homologen 3D-Strukturen zu finden waren, werden nun mit Hilfe von verschiedenen Servern Proteine mit ähnlichen Strukturen zugeordnet.

Server ähnliche Strukturen PSSM-Value/Z-score
3D-pssm - Ergebnis 1gof 0.00621
  1eut 0.00814
  1jhj 0.0281
123D+ - Ergebnis 1eut 7.10
  1k3i 6.18
  1jhj 5.59

Alignments zwischen gesuchtem Protein und ähnlichen Strukturen

Mit den .pdb Dateinen (von Fold Recognition) haben wir mit Hilfe von FUGUE *.pir-Dateien erhalten und mit Hilfe vom Modeller eine mögliche 3D-Struktur unseres gesuchten Proteins erstellen lassen. Diese sind hier sichtbar.

Vergleich der verschiedenen Varianten

Schon die Server untereinander zeigten sehr unterschiedliche Ergebnisse. Die von uns geschaffenen Möglichkeiten sind ebenfalls zahlreich, zeigen aber nicht so eine starke Streuung.

Daher läßt sich abschließend sagen, dass die Berechnung über die verschiedenen Server schon schnell einen Eindruck des Proteins vermitteln kann. Jedoch für exakte Beschreibungen des Moleküls sind Berechnungen per Hand wohl unumgänglich.

Lokalisation einer funktionalen Einheit

In diesem Teil der Arbeit haben wir uns mit dem Protein 1wdo von Sulfolobus tokadaii befasst, welches wir unter der Nummer T0265 von CASP6 erhalten haben. Bei diesem Protein handelt es sich um ein Transkriptionsregulator der folglich eine Bindungsstelle zur DNA aufweisen muss.

Es gibt folgende DNA bindende Motive:

Ein Leucin-Zipper bindet mit einer Abfolge von basischen Aminosäuren an die DNA (ARG, LYS). Unser Protein beinhaltet lediglich drei aufeinanderfolgende Lysine und besteht ansonsten kaum aus basischen Aminosäuren.

Der Zinkfinger beinhaltet zwei nah benachbarte Cysteine, 12 weitere Aminosäuren und dann zwei nah benachbarte Histidine. Unser Protein beinhaltet noch nicht einmal ein Histidin.

Helix-Turn-Helix-Motive sind auffindbar (auch in anderen Transkriptionsregulatoren):

Wir haben die errechnete Sequenz unseres Regulators funktionell ähnlichen 3D-Strukturen aus der pdb Datenbank verglichen. Homologe Strukturen haben sich mit BLAST finden lassen. Die Ergebnisse sind hier zu bewundern.

Interessant ist ebenfalls die Tatsache, dass alle Proteine benachbart zu solchen Motiven zusätzlich gleich $ \beta$-Loop-$ \beta$ Strukturen aufweisen.

About this document ...

This document was generated using the LaTeX2HTML translator Version 2002-2-1 (1.70)

Copyright © 1993, 1994, 1995, 1996, Nikos Drakos, Computer Based Learning Unit, University of Leeds.
Copyright © 1997, 1998, 1999, Ross Moore, Mathematics Department, Macquarie University, Sydney.

The command line arguments were:
latex2html -split 0 protocol.tex

The translation was initiated by ma li on 2004-11-03


ma li 2004-11-03