Datentyp: Molekülstrukturen
Die meisten Datentypen von Molekülstrukturen werden im Kapitel "Repräsentation chemischer Strukturen" detaillierter besprochen. Hier ist noch einmal eine kurze Zusammenstellung.
Theoretisch ist es möglich eine Verbindung mit nur einer Datenstruktur darzustellen z.B. mit der Bindungsliste (CT), praktisch wird aber für die jeweilige Anwendung eine geeignete Datenstruktur benutzt.
Für die Repräsentation eine Moleküls sind ganz andere Datentypen sinnvoll als bei Datenbank-Anwendungen oder Datenanalysen.
In Moleküldarstellungen bzw. quatenchemischen Berechnungen werden u.a. Bindungslisten (Mol-, PDB-File) oder Moleküldarstellungen im Kartesischen bzw. internen Koordinatensystem (xyz-File) verwendet.
In Datenbank-Anwendungen und Datenanalysen werden häufig, aufgrund der schnelleren Prozessierbarkeit, Bitvektoren eingesetzt. Hierbei wird die Information in einen Bit-String (Zeichenkette) mit definierter Länge als 0 und 1 codiert. Die drei wichtigsten Methoden um Molekülstrukturen und deren Eigenschaften in Bits zu Codieren sind:
- Hashcodes (u.a. geeignet für Struktursuchen in Datenbanken)
- Strukturschlüsssel (u.a. geeignet für Struktur- und Ähnlichkeitssuchen)
- Fingerprints (u.a. geeignet für Sub-Struktursuchen)
Ein ganz andere Möglichkeit Molekülstrukturen und die dazugehörige Information wie z.B. Spektren, physikochemische und biologisch Eigenschaften in einem zu verarbeiten bietet CML mit einer eigenen Auszeichnungssprache.
© Prof. Dr. J. Gasteiger, Dr. Th. Engel, CCC Univ. Erlangen, Wed Apr 7 12:05:55 2004 GMT
BMBF-Leitprojekt Vernetztes Studium - Chemie
|