Als nächstes analysierten wir die erhaltenen Sekundärstrukturen um eventuell Konsensussequenzen herauszufinden.
Mit dem Tool ProtoNet haben wir uns für unser Target Templates besorgt, welche im selben Cluster 249766 (Malate dehydrogenase, active site) wie unser Target T0227 liegen. Dadurch haben wir 5 Templates erhalten.
Template 1emd (PDB Descriptor):
>1EMD:_ MALATE DEHYDROGENASE (E.C.1.1.1.37) - CHAIN _ MKVAVLGAAGGIGQALALLLKTQLPSGSELSLYDIAPVTPGVAVDLSHIPTAVKIKGFSG EDATPALEGADVVLISAGVRRKPGMDRSDLFNVNAGIVKNLVQQVAKTCPKACIGIITNP VNTTVAIAAEVLKKAGVYDKNKLFGVTTLDIIRSNTFVAELKGKQPGEVEVPVIGGHSGV TILPLLSQVPGVSFTEQEVADLTKRIQNAGTEVVEAKAGGGSATLSMGQAAARFGLSLVR ALQGEQGVVECAYVEGDGQYARFFSQPLLLGKNGVEERKSIGTLSAFEQNALEGMLDTLK KDIALGQEFVNK
Template 1mld (PDB Descriptor) mit Chain A, Chain B, Chain C, Chain D:
>1MLD:A MALATE DEHYDROGENASE (E.C.1.1.1.37) - CHAIN A AKVAVLGASGGIGQPLSLLLKNSPLVSRLTLYDIAHTPGVAADLSHIETRATVKGYLGPE QLPDCLKGCDVVVIPAGVPRKPGMTRDDLFNTNATIVATLTAACAQHCPDAMICIISNPV NSTIPITAEVFKKHGVYNPNKIFGVTTLDIVRANAFVAELKGLDPARVSVPVIGGHAGKT IIPLISQCTPKVDFPQDQLSTLTGRIQEAGTEVVKAKAGAGSATLSMAYAGARFVFSLVD AMNGKEGVVECSFVKSQETDCPYFSTPLLLGKKGIEKNLGIGKISPFEEKMIAEAIPELK ASIKKGEEFVKNMK >1MLD:B MALATE DEHYDROGENASE (E.C.1.1.1.37) - CHAIN B AKVAVLGASGGIGQPLSLLLKNSPLVSRLTLYDIAHTPGVAADLSHIETRATVKGYLGPE QLPDCLKGCDVVVIPAGVPRKPGMTRDDLFNTNATIVATLTAACAQHCPDAMICIISNPV NSTIPITAEVFKKHGVYNPNKIFGVTTLDIVRANAFVAELKGLDPARVSVPVIGGHAGKT IIPLISQCTPKVDFPQDQLSTLTGRIQEAGTEVVKAKAGAGSATLSMAYAGARFVFSLVD AMNGKEGVVECSFVKSQETDCPYFSTPLLLGKKGIEKNLGIGKISPFEEKMIAEAIPELK ASIKKGEEFVKNMK >1MLD:C MALATE DEHYDROGENASE (E.C.1.1.1.37) - CHAIN C AKVAVLGASGGIGQPLSLLLKNSPLVSRLTLYDIAHTPGVAADLSHIETRATVKGYLGPE QLPDCLKGCDVVVIPAGVPRKPGMTRDDLFNTNATIVATLTAACAQHCPDAMICIISNPV NSTIPITAEVFKKHGVYNPNKIFGVTTLDIVRANAFVAELKGLDPARVSVPVIGGHAGKT IIPLISQCTPKVDFPQDQLSTLTGRIQEAGTEVVKAKAGAGSATLSMAYAGARFVFSLVD AMNGKEGVVECSFVKSQETDCPYFSTPLLLGKKGIEKNLGIGKISPFEEKMIAEAIPELK ASIKKGEEFVKNMK >1MLD:D MALATE DEHYDROGENASE (E.C.1.1.1.37) - CHAIN D AKVAVLGASGGIGQPLSLLLKNSPLVSRLTLYDIAHTPGVAADLSHIETRATVKGYLGPE QLPDCLKGCDVVVIPAGVPRKPGMTRDDLFNTNATIVATLTAACAQHCPDAMICIISNPV NSTIPITAEVFKKHGVYNPNKIFGVTTLDIVRANAFVAELKGLDPARVSVPVIGGHAGKT IIPLISQCTPKVDFPQDQLSTLTGRIQEAGTEVVKAKAGAGSATLSMAYAGARFVFSLVD AMNGKEGVVECSFVKSQETDCPYFSTPLLLGKKGIEKNLGIGKISPFEEKMIAEAIPELK ASIKKGEEFVKNMK
Template 1lib6 (PDB Descriptor) mit Chain A, Chain B, Chain C, Chain D:
>1IB6:A MALATE DEHYDROGENASE MKVAVLGAAGGIGQALALLLKTQLPSGSELSLYDIAPVTPGVAVDLSHIPTAVKIKGFSG EDATPALEGADVVLISAGVARKPGMDRSDLFNVNAGIVKNLVQQVAKTCPKACIGIITNP VNTTVAIAAEVLKKAGVYDKNKLFGVTTLDIICSNTFVAELKGKQPGEVEVPVIGGHSGV TILPLLSQVPGVSFTEQEVADLTKRIQNAGTEVVEAKAGGGSATLSMGQAAARFGLSLVR ALQGEQGVVECAYVEGDGQYARFFSQPLLLGKNGVEERKSIGTLSAFEQNALEGMLDTLK KDIALGQEFVNK >1IB6:B MALATE DEHYDROGENASE MKVAVLGAAGGIGQALALLLKTQLPSGSELSLYDIAPVTPGVAVDLSHIPTAVKIKGFSG EDATPALEGADVVLISAGVARKPGMDRSDLFNVNAGIVKNLVQQVAKTCPKACIGIITNP VNTTVAIAAEVLKKAGVYDKNKLFGVTTLDIICSNTFVAELKGKQPGEVEVPVIGGHSGV TILPLLSQVPGVSFTEQEVADLTKRIQNAGTEVVEAKAGGGSATLSMGQAAARFGLSLVR ALQGEQGVVECAYVEGDGQYARFFSQPLLLGKNGVEERKSIGTLSAFEQNALEGMLDTLK KDIALGQEFVNK >1IB6:C MALATE DEHYDROGENASE MKVAVLGAAGGIGQALALLLKTQLPSGSELSLYDIAPVTPGVAVDLSHIPTAVKIKGFSG EDATPALEGADVVLISAGVARKPGMDRSDLFNVNAGIVKNLVQQVAKTCPKACIGIITNP VNTTVAIAAEVLKKAGVYDKNKLFGVTTLDIICSNTFVAELKGKQPGEVEVPVIGGHSGV TILPLLSQVPGVSFTEQEVADLTKRIQNAGTEVVEAKAGGGSATLSMGQAAARFGLSLVR ALQGEQGVVECAYVEGDGQYARFFSQPLLLGKNGVEERKSIGTLSAFEQNALEGMLDTLK KDIALGQEFVNK >1IB6:D MALATE DEHYDROGENASE MKVAVLGAAGGIGQALALLLKTQLPSGSELSLYDIAPVTPGVAVDLSHIPTAVKIKGFSG EDATPALEGADVVLISAGVARKPGMDRSDLFNVNAGIVKNLVQQVAKTCPKACIGIITNP VNTTVAIAAEVLKKAGVYDKNKLFGVTTLDIICSNTFVAELKGKQPGEVEVPVIGGHSGV TILPLLSQVPGVSFTEQEVADLTKRIQNAGTEVVEAKAGGGSATLSMGQAAARFGLSLVR ALQGEQGVVECAYVEGDGQYARFFSQPLLLGKNGVEERKSIGTLSAFEQNALEGMLDTLK KDIALGQEFVNK
Template 1ie3 (PDB Descriptor) mit Chain A, Chain B, Chain C, Chain D:
>1IE3:A MALATE DEHYDROGENASE MKVAVLGAAGGIGQALALLLKTQLPSGSELSLYDIAPVTPGVAVDLSHIPTAVKIKGFSG EDATPALEGADVVLISAGVARKPGMDRSDLFNVNAGIVKNLVQQVAKTCPKACIGIITNP VNTTVAIAAEVLKKAGVYDKNKLFGVTTLDIICSNTFVAELKGKQPGEVEVPVIGGHSGV TILPLLSQVPGVSFTEQEVADLTKRIQNAGTEVVEAKAGGGSATLSMGQAAARFGLSLVR ALQGEQGVVECAYVEGDGQYARFFSQPLLLGKNGVEERKSIGTLSAFEQNALEGMLDTLK KDIALGQEFVNK >1IE3:B MALATE DEHYDROGENASE MKVAVLGAAGGIGQALALLLKTQLPSGSELSLYDIAPVTPGVAVDLSHIPTAVKIKGFSG EDATPALEGADVVLISAGVARKPGMDRSDLFNVNAGIVKNLVQQVAKTCPKACIGIITNP VNTTVAIAAEVLKKAGVYDKNKLFGVTTLDIICSNTFVAELKGKQPGEVEVPVIGGHSGV TILPLLSQVPGVSFTEQEVADLTKRIQNAGTEVVEAKAGGGSATLSMGQAAARFGLSLVR ALQGEQGVVECAYVEGDGQYARFFSQPLLLGKNGVEERKSIGTLSAFEQNALEGMLDTLK KDIALGQEFVNK >1IE3:C MALATE DEHYDROGENASE MKVAVLGAAGGIGQALALLLKTQLPSGSELSLYDIAPVTPGVAVDLSHIPTAVKIKGFSG EDATPALEGADVVLISAGVARKPGMDRSDLFNVNAGIVKNLVQQVAKTCPKACIGIITNP VNTTVAIAAEVLKKAGVYDKNKLFGVTTLDIICSNTFVAELKGKQPGEVEVPVIGGHSGV TILPLLSQVPGVSFTEQEVADLTKRIQNAGTEVVEAKAGGGSATLSMGQAAARFGLSLVR ALQGEQGVVECAYVEGDGQYARFFSQPLLLGKNGVEERKSIGTLSAFEQNALEGMLDTLK KDIALGQEFVNK >1IE3:D MALATE DEHYDROGENASE MKVAVLGAAGGIGQALALLLKTQLPSGSELSLYDIAPVTPGVAVDLSHIPTAVKIKGFSG EDATPALEGADVVLISAGVARKPGMDRSDLFNVNAGIVKNLVQQVAKTCPKACIGIITNP VNTTVAIAAEVLKKAGVYDKNKLFGVTTLDIICSNTFVAELKGKQPGEVEVPVIGGHSGV TILPLLSQVPGVSFTEQEVADLTKRIQNAGTEVVEAKAGGGSATLSMGQAAARFGLSLVR ALQGEQGVVECAYVEGDGQYARFFSQPLLLGKNGVEERKSIGTLSAFEQNALEGMLDTLK KDIALGQEFVNK
Template 2cmd (PDB Descriptor):
>2CMD:_ MALATE DEHYDROGENASE (E.C.1.1.1.37) - CHAIN _ MKVAVLGAAGGIGQALALLLKTQLPSGSELSLYDIAPVTPGVAVDLSHIPTAVKIKGFSG EDATPALEGADVVLISAGVRRKPGMDRSDLFNVNAGIVKNLVQQVAKTCPKACIGIITNP VNTTVAIAAEVLKKAGVYDKNKLFGVTTLDIIRSNTFVAELKGKQPGEVEVPVIGGHSGV TILPLLSQVPGVSFTEQEVADLTKRIQNAGTEVVEAKAGGGSATLSMGQAAARFGLSLVR ALQGEQGVVECAYVEGDGQYARFFSQPLLLGKNGVEERKSIGTLSAFEQNALEGMLDTLK KDIALGQEFVNK
Die Templates sind recht unterschiedlich. Wir sind gespannt wie unsere Modelle aussehen. Sicherlich werden die Modelle recht ähnlich aussehen. Um die Modelle zu erzeugen haben wir von der PDB Datenbank die Template pdb-Files heruntergeladen und mittels FUGUE pir-Files erzeugt (dabei wurde ein Strukturalignment zwischen Target und Template erzeugt).
Mit Hilfe des MODELLERs wurde ein 3D-Modell des Targets zum jeweiligen Template erzeugt.
Ausgaben des MODELLERs:
Protein 1emd allein:
Protein 1mld allein:
Protein 1lib6 allein:
Protein 1ie3 allein:
Protein 2cmd allein:
ProFit berechnet den mittleren Abstand aller Residuen für zwei gegebene Protein Strukturen. Je kleiner der Abstand ist, desto besser passt das Modell an die Vorlage.
Modell | Score in Å |
1emd | 6.758 |
1lib6 | 1.277 |
1ie3 | 12.904 |
1mld | 16.584 |
2cmd |
Nur der Wert für das Template 1lib6 hat einen kleinen Wert. Somit passt das Target nur auf dieses Templat recht gut. Die anderen Templates haben sehr starke Abweichungen zu unserem Target. Damit sind sie als Template nicht geeignet. Wir vermuten dass dies so ist, weil das verwendete Classification-Tool ProtoNet nach bestehenden Clustern sucht. Beim Clustering können unter Umständen (je nach verwendetem Algorithmus) sehr unterschiedliche Ergebnisse entstehen. Eine Aufgabe könnte jetzt sein, sich mit diesem Tool etwas mehr auseinander zu setzen, um die Funktionsweise besser zu verstehen. Vielleicht wird einem dann auch das Ergebnis der Abfrage von ProtoNet etwas klarer.