Kapitelanfang Vorige Seite Nächste Seite Nächstes Kapitel
VERN Home navigation
 
Chemoinformatik
Einführung in die Chemoinformatik
Repräsentation chemischer Strukturen
Repräsentation chemischer Reaktionen
Datentypen/Datenformate
Datenbanken/Datenquellen
Suchmethoden
Deskriptoren für chemische Verbindungen
Einführung
Einleitung
Definition
Fingerprints
Distanz- und Ähnlichkeitsmaße
Topologische Deskriptoren
Laplace Matrix
Wiener Index
Randic Konnektivitäts Index
Topologische Autokorrelationsvektoren
Feature Trees
3D Autokorrelation
3D MoRSE Code
Radiale Verteilungsfunktion
Beispiele RDF
Weitere Deskriptoren
CoMFA
BCUT
4D-QSAR
HYBOT Deskriptoren
Nicht-Strukturbasierte Deskriptoren
Eigenschaften von Strukturdeskriptoren
Literatur
Methoden zur Datenanalyse
Anwendungen

Startseite

Strukturschlüssel und 1D Fingerabdrücke

Strukturschlüssel (structure keys) beschreiben die chemische Zusammensetzung und Strukturmotive von Molekülen durch eine Boolsche Zeichenkette (array). Ist ein bestimmtes Strukturmerkmal im Molekül oder einer Substruktur vorhanden, wird ein Bit nach 1 gesetzt (wahr), andernfalls nach 0 (falsch). Ein Bit in dieser Zeichenkette codiert somit eine bestimmte funktionelle Gruppe (wie z.B. Carbonsäure), ein Strukturelement (z.B. substituiertes Cyclohexan) oder aber auch das Auftreten bestimmter Elemente (z.B. Kohlenstoffatom). Alternativ kann der Strukturschlüssel auch als Zeichenkette von ganzen Zahlen (Integer) definiert werden, wobei die Elemente dieser Zeichenkette aussagen, wie häufig ein Molekülmerkmal auftritt.

Ein Fingerabdruck (fingerprint) ist eine Boolsche Zeichenkette in der, im Gegensatz zum Strukturschlüssel, die Bedeutung eines Bits vorher nicht festgelegt worden ist. Zunächst sind im Fingerabdruck mit definierter Länge alle Bits auf 0 gesetzt. Im zweiten Schritt wird für jedes Atom (0-Bindungspfad), für jedes Paar an benachbarten Atomen mit einer Bindung (1-Bindungspfad) und für alle Atomgruppen die über einen längeren Bindungsweg verbunden sind (normalerweise bis zu 7 oder 8 Bindungen), eine Liste der Muster generiert. Dann wird jedem Muster der Verbindung durch einen Hashcode-Algorithmus, eine eindeutige Zahl an Bits zugeordnet (typischerweise 4 oder 5 Bits pro Muster). Die Menge an erhaltenen Bits wird dem Fingerabdruck durch den logischen Ausdruck OR hinzugefügt. Angenommen ein Muster ist eine Substruktur eines Moleküls, so wird jedes Bit im Muster des Fingerabdrucks zum Molekülfingerabdruck umgesetzt.


© Prof. Dr. J. Gasteiger, Dr. Th. Engel, CCC Univ. Erlangen, Wed Jun 9 12:55:24 2004 GMT
navigation BMBF-Leitprojekt Vernetztes Studium - Chemie
Kapitelanfang Vorige Seite Nächste Seite Nächstes Kapitel