Strukturschlüssel und 1D Fingerabdrücke
Strukturschlüssel (structure keys) beschreiben die chemische Zusammensetzung und Strukturmotive von Molekülen durch eine Boolsche Zeichenkette (array). Ist ein bestimmtes Strukturmerkmal im Molekül oder einer Substruktur vorhanden, wird ein Bit nach 1 gesetzt (wahr), andernfalls nach 0 (falsch). Ein Bit in dieser Zeichenkette codiert somit eine bestimmte funktionelle Gruppe (wie z.B. Carbonsäure), ein Strukturelement (z.B. substituiertes Cyclohexan) oder aber auch das Auftreten bestimmter Elemente (z.B. Kohlenstoffatom). Alternativ kann der Strukturschlüssel auch als Zeichenkette von ganzen Zahlen (Integer) definiert werden, wobei die Elemente dieser Zeichenkette aussagen, wie häufig ein Molekülmerkmal auftritt.
Ein Fingerabdruck (fingerprint) ist eine Boolsche Zeichenkette in der, im Gegensatz zum Strukturschlüssel, die Bedeutung eines Bits vorher nicht festgelegt worden ist. Zunächst sind im Fingerabdruck mit definierter Länge alle Bits auf 0 gesetzt. Im zweiten Schritt wird für jedes Atom (0-Bindungspfad), für jedes Paar an benachbarten Atomen mit einer Bindung (1-Bindungspfad) und für alle Atomgruppen die über einen längeren Bindungsweg verbunden sind (normalerweise bis zu 7 oder 8 Bindungen), eine Liste der Muster generiert. Dann wird jedem Muster der Verbindung durch einen Hashcode-Algorithmus, eine eindeutige Zahl an Bits zugeordnet (typischerweise 4 oder 5 Bits pro Muster). Die Menge an erhaltenen Bits wird dem Fingerabdruck durch den logischen Ausdruck OR hinzugefügt. Angenommen ein Muster ist eine Substruktur eines Moleküls, so wird jedes Bit im Muster des Fingerabdrucks zum Molekülfingerabdruck umgesetzt.
© Prof. Dr. J. Gasteiger, Dr. Th. Engel, CCC Univ.
Erlangen, Wed Jun 9 12:55:24 2004 GMT
BMBF-Leitprojekt
Vernetztes Studium - Chemie
|