Die Abfolge der Aminosäuren in der Polypeptidkette bestimmt unter definierten Umgebungsverhältnissen deren Faltung (oder Entfaltung) in eine festgelegte dreidimensionale Struktur, die Tertiärstruktur. Es gibt zwei Methoden, die 3D-Struktur eines Proteins experimentell in hoher Auflösung zu bestimmen, entweder per Röntgenkristallografie oder per NMR-Spektroskopie. Zur NMR-Methode finden sich gute Übersichtsbeiträge am Birkbeck-College (Kurt D. Berndt), am Imperial-College (Henry Rzepa) sowie an der Queens University. Schließlich sei noch auf die Methodenzusammenstellung auf der Webseite der PDB-Proteindatenbank hingewiesen. Die Faltung eines Proteins beinhaltet so viele Wechselwirkungen zwischen den Atomen der Polypeptidkette - und der Umgebung (z.B. Wassermoleküle oder Lipide), dass seine 3D-Struktur (noch) nicht im voraus berechnet werden kann. Eine gute (wenngleich nicht super-aktuelle) Einführung in die Problematik der Strukturvorhersage gibt es von Rob Russell am EMBL in Heidelberg.
Ein theoretisch möglicher Ansatz wäre, sämtliche Bindungswinkel zwischen allen Atomen durchzuprobieren und die entstehenden Strukturen hinsichtlich ihrer Stabilität rechnerisch zu untersuchen. Dieser Ansatz erfordert aber bei weitem zu viel Rechenaufwand und kann höchstens auf kurze Modellpeptide angewendet werden. Alternativ kann die Konformation kurzer Peptide vorausberechnet oder aus bekannten 3D-Strukturen extrahiert werden, um anschließend die Peptide miteinander zu einer kompletten 3D-Struktur zu kombinieren ("Fragment Assembly"). Beispiel (klein, groß).
Aufgrund der Fortschritte in der Aufklärung von Genomsequenzen und 3D-Strukturen steigt die Chance, dass man zu einer Aminosäuresequenz ein homologes Protein finden wird, dessen Struktur bekannt ist. Wenn die Ähnlichkeit gross genug ist (> 30 %, besser > 50 % identische Aminosäuren), kann man versuchen, mittels Homology-Building für das unbekannte Protein ein Modell seiner Struktur zu berechnen. Dabei werden die Bereiche, die sich in einer definierten Sekundärstruktur befinden, am besten vorausberechnet werden, wohingegen oberflächen-exponierte Loops oder frei-bewegliche Seitenketten nur schlecht modelliert werden können. Beispiel (klein, groß). Interessante Online-Kurse zum Molecular Modelling gibt es am Centre for Molecular and Biomolecular Informatics (CMBI) in Nijmegen, am Center for Biological Sequence Analysis (CBS) in Kopenhagen, und an der Mount Sinai School of Medicine in New York.
Ein alternativer Ansatz besteht darin, ausgehend von vorhandenen Protein-Folds zu versuchen, eine Sequenz in alle möglichen Folds "einzupassen". Diese Methode wird als Threading bezeichnet. Sie bezieht ihre Berechtigung aus der Tatsache, dass im Laufe der Evolution nur eine begrenzte Anzahl prinzipieller Protein-Folds entstanden ist (ca. 1000) und somit mit zunehmender Anzahl gelöster Strukturen die Erfolgschance dieses Ansatzes weiter steigt, da sämtliche Protein-Folds bzw -Superfamilien (ca. 15000) eines Tages in der Strukturdatenbank repräsentiert sein werden. Beispiel (klein, groß). | ||||||||||||||||||||||||