Bioinformatik

Molekularbiologie im Internet

Hauptseite

Termine

Bioinformatik

Literatur

Übungen

Aufgaben

Datenbanken

Software

Sequenzvergleiche

Homologiesuche

Motivsuche

Hidden Markov-Modelle

Hydrophobizitäts-Analyse

Topologie und Helixpackung

Proteinlokalisation

Sekundärstruktur

Super-Sekundärstruktur

3D-Struktur

 

    Tertiärstruktur-Vorhersage von Proteinen:

    Die Abfolge der Aminosäuren in der Polypeptidkette bestimmt unter definierten Umgebungsverhältnissen deren Faltung (oder Entfaltung) in eine festgelegte dreidimensionale Struktur, die Tertiärstruktur. Es gibt zwei Methoden, die 3D-Struktur eines Proteins experimentell in hoher Auflösung zu bestimmen, entweder per Röntgenkristallografie oder per NMR-Spektroskopie. Zur NMR-Methode finden sich gute Übersichtsbeiträge am Birkbeck-College (Kurt D. Berndt), am Imperial-College (Henry Rzepa) sowie an der Queens University. Schließlich sei noch auf die Methodenzusammenstellung auf der Webseite der PDB-Proteindatenbank hingewiesen.

    Die Faltung eines Proteins beinhaltet so viele Wechselwirkungen zwischen den Atomen der Polypeptidkette - und der Umgebung (z.B. Wassermoleküle oder Lipide), dass seine 3D-Struktur (noch) nicht im voraus berechnet werden kann.

    Eine gute (wenngleich nicht super-aktuelle) Einführung in die Problematik der Strukturvorhersage gibt es von Rob Russell am EMBL in Heidelberg.

    ab initio Modeling:

    Ein theoretisch möglicher Ansatz wäre, sämtliche Bindungswinkel zwischen allen Atomen durchzuprobieren und die entstehenden Strukturen hinsichtlich ihrer Stabilität rechnerisch zu untersuchen. Dieser Ansatz erfordert aber bei weitem zu viel Rechenaufwand und kann höchstens auf kurze Modellpeptide angewendet werden. Alternativ kann die Konformation kurzer Peptide vorausberechnet oder aus bekannten 3D-Strukturen extrahiert werden, um anschließend die Peptide miteinander zu einer kompletten 3D-Struktur zu kombinieren ("Fragment Assembly"). Beispiel (klein, groß).

  • Protinfo - protein modelling server
  • ROSETTA
  • ROBETTA

    Homology Modeling:

    Aufgrund der Fortschritte in der Aufklärung von Genomsequenzen und 3D-Strukturen steigt die Chance, dass man zu einer Aminosäuresequenz ein homologes Protein finden wird, dessen Struktur bekannt ist. Wenn die Ähnlichkeit gross genug ist (> 30 %, besser > 50 % identische Aminosäuren), kann man versuchen, mittels Homology-Building für das unbekannte Protein ein Modell seiner Struktur zu berechnen. Dabei werden die Bereiche, die sich in einer definierten Sekundärstruktur befinden, am besten vorausberechnet werden, wohingegen oberflächen-exponierte Loops oder frei-bewegliche Seitenketten nur schlecht modelliert werden können. Beispiel (klein, groß).

    Interessante Online-Kurse zum Molecular Modelling gibt es am Centre for Molecular and Biomolecular Informatics (CMBI) in Nijmegen, am Center for Biological Sequence Analysis (CBS) in Kopenhagen, und an der Mount Sinai School of Medicine in New York.

  • SWISS-MODEL (GlaxoWellcome) ist ein PublicDomain-Server, der solche Strukturvorhersagen erlaubt.
  • CPHmodels erlaubt ein Homology-Building mittels eines neuronalen Netzwerkes.

    Weitere Server zum Homology Modelling sind:

  • 3D-JIGSAW vom Cancer Research Institute (UK) modelliert nicht nur die main chain-Atome, sondern auch die side chain-Atome
  • GENO3D am Institut de Biologie et Chimie des Protéines in Lyon
  • SDSC1 am San Diego Supercomputer Center

  • An der Rockefeller-University wurde das Programm MODELLER entwickelt; dabei handelt es sich allerdings nicht um einen Webserver. Weitere Software-Pakete zum Molecular Modelling sind WHAT IF sowie Insight II und Cerius2 von Accelrys Inc..
    Threading:

    Ein alternativer Ansatz besteht darin, ausgehend von vorhandenen Protein-Folds zu versuchen, eine Sequenz in alle möglichen Folds "einzupassen". Diese Methode wird als Threading bezeichnet. Sie bezieht ihre Berechtigung aus der Tatsache, dass im Laufe der Evolution nur eine begrenzte Anzahl prinzipieller Protein-Folds entstanden ist (ca. 1000) und somit mit zunehmender Anzahl gelöster Strukturen die Erfolgschance dieses Ansatzes weiter steigt, da sämtliche Protein-Folds bzw -Superfamilien (ca. 15000) eines Tages in der Strukturdatenbank repräsentiert sein werden. Beispiel (klein, groß).

  • Das Programm 3D-PSSM vom Imperial Cancer Research Institute ist auf einem Web-Server implementiert, der solch ein Threading im Internet erlaubt.
  • Phyre (Protein Homology/analogY Recognition Engine) ist der Nachfolger von 3D-PSSM.

    Weitere Server zum Threading bzw. zur Fold Recognition gibt es an folgenden Adressen:

  • DOE Fold-Server (FRSVR) an der University of California at Los Angeles (Login)
  • FFAS (Fold & Function Assignment System) am Burnham Institute, La Jolla, California (Login)
  • FFAS03 am Burnham Institute, La Jolla, California
  • Fugue an der University of Cambridge, UK
  • INBGU an der Ben Gurion University, Israel
  • LOOPP (Learning, Observing and Outputting Protein Patterns) an der Cornell-University in Ithaca, NY.
  • Pmembr: A threading method for membrane proteins.
  • PROSPECT (PROtein Structure Prediction and Evaluation Computer Toolkit) am Oak Ridge National Laboratory
  • SAM (Sequence Alignment and Modeling System) an der University of California at San Francisco
  • Sausage (Sequence-structure Alignment Using a Statistical Approach Guided by Experiment ) an der Australian National University Canberra (replaced by WURST )
  • ssPsi an der Stockholm University (OUTDATED)
  • Superfamily an der University of Cambridge, UK
  • genTHREADER an der Brunel University, Uxbridge, UK
  • TUNE1D (Threading Using Neural nEtwork with one-dimensional profile) am Medical Research Council, UK
  • 123D+ am NCIFCRF (USA)

  • Pcons was the first consensus server for fold recognition. It can be used at the Bioinformatics Laboratory (IIMCB) in Warshaw and at the Stockholm Bioinformatics Center (CBS). Pmodeller is an addition on top of Pcons. In Pmodeller all atom models are built, and also evaluated using ProQ. It has been shown in CASP5 that Pmodeller works better than Pcons. Currently Pmodeller (based on Pcons-2) and Pmodeller-4 (based on Pcons-4) is used.
  • 3D-Jury von BioInfo war der erfolgreichste Metaserver während des CASP5-Wettbewerbs.
  • LiveBench ist eine Plattform, die verschiedene Threading-Server miteinander vergleicht.
  • ProCeryon ist ein Software-Paket zum Threading, das nicht im Netz zur Verfügung steht.

    Visualisierung von 3D-Strukturen:

    Zur Visualisierung von 3D-Strukturen gibt es verschiedene Programme, von denen die meisten lokal auf dem eigenen Computer installiert werden müssen (was im Rahmen dieses Kurses leider nicht möglich ist):

  • Deep View (Swiss-Pdb Viewer), von Manuel C. Peitsch entworfen, wird ebenfalls von GlaxoWellcome bereitgestellt (Beispiel)
  • Cn3D, am NIH bereitgestellt (Beispiel #1, Beispiel #2)
  • RasMol, geschrieben von Roger Sayle, University of Massachusetts, Amherst, USA (Beispiel)
  • RasMol and OpenRasMol
  • MAGE und PREKIN, von Jane und David Richardson eingeführt, produzieren sog. Kinemages (kinetic images). Die Zeitschrift Protein Science erlaubt die Publikation solcher Abbildungen und stellt diese online zur Verfügung.
  • Chime ist ein RasMol-basierendes Programm, das als Plug-In innerhalb eines Web-Browsers läuft und dort Strukturen darstellen kann, von denen die Koordinaten auf einer Webseite hinterlegt sind.

  • Protein Explorer, Protein Morpher und Noncovalent Bond Finder (NCBF) sind Anwendungen, die Chime benötigen und in der Lage sind, 3D-Strukturen und in verschiedenen Ansichten darzustellen oder zu animieren bzw. Wasserstoffbrückenbindungen zu berechnen.

  • Protein Explorer vs. RasMol

  • WebMol, von Dirk Walther am EMLB Heidelberg geschrieben, ist ein JAVA-basierendes Programm, das die Visualisierung von 3D-Strukturen auf dem eigenen Webbrowser ermöglicht.

    Desweiteren besteht die Möglichkeit, sich vorgefertigte Abbildungen von 3D-Strukturen anzuschauen oder als File (z.B. im PDF-Format) abzuspeichern:

  • IMB Library
  • Swiss-3DImage
  • PDB-Images
  • PDB-Molecule of the Month
    Beispielsequenzen:

  • Aminosäuresequenz-Datenbank via Entrez

  • 2-component response regulator HrpG von Xanthomonas campestris pv. vesicatoria
  • 2-component response regulator OmpR von Escherichia coli
  • 2-component response regulator PhoB von Escherichia coli

  • AraC-type regulator HrpX von Xanthomonas campestris pv. vesicatoria
  • Arabinose regulator AraC von Escherichia coli
  • Multiple antibiotic resistance protein MarA von Escherichia coli

 

Letzte Aktualisierung: 20. September 2005


Ralf Koebnik
Institut für Genetik
Abt. Pflanzengenetik
Weinbergweg 10
06120 Halle/Saale
Telefon: 0345 / 55 26 293 (Büro) bzw. 296 (Labor)
Fax: 0345 / 55 27 151
Email: koebnik (at) gmx.de
Please replace (at) by @.


Home Zurück zur Hauptseite