Kapitelanfang Vorige Seite Nächste Seite Nächstes Kapitel
VERN Home navigation
 
Chemoinformatik
Einführung in die Chemoinformatik
Repräsentation chemischer Strukturen
Einleitung
Nomenklatur
Linearnotation
Einführung
Wisewesser II
Rosdal
  SMILES I
SMILES II
SLN I
SLN II
Beurteilung
Konstitutionscodierung
3D-Codierung
Oberflächen
Literatur
Repräsentation chemischer Reaktionen
Daten/Datenformate
Datenbanken/Datenquellen
Struktur-Suchmethoden
Berechnung physikalischer und chemischer Daten
Deskriptoren für chemische Verbindungen
Methoden zur Datenanalyse
Anwendungen

Startseite

Die SMILES-Codierung

Dave Weiniger von Daylight Chemical Information Systems entwickelte 1986 die SMILES- (Simplified Molecular Input Line Entry Specification) Notation am US Environmental Research Laboratory (USEPA) zur Verarbeitung chemischer Daten. Die flexible, leicht erlernbare Sprache beschreibt chemische Strukturen in Form einer Linearnotation. Darin wird die chemische Strukturinformation stark komprimiert und vereinfacht, wodurch diese Sprache als universelle chemische Nomenklatur- und Datenkonvertiermöglichkeit weite Verbreitung findet, unabhängig von der Software oder der Hardware-Architektur.

Im Vergleich zu WLN und ROSDAL nutzt SMILES nur sechs einfache Grundregeln um eine Struktur in eine Zeichenkette umzusetzen.

Die Basisregeln sind:

  1. Atome werden mit ihren Elementsymbolen dargestellt
  2. Wasserstoffatome sättigen automatisch freie Valenzen ab (einfache Wasserstoffbindung) und werden nicht geschrieben
  3. benachbarte Atome stehen im Code nebeneinander
  4. Doppel- und Dreifachbindungen werden durch " = " bzw. " # " gekennzeichnet
  5. Verzweigungen stehen in runden Klammern
  6. Ringschlüsse werden durch Zuordnung von Zahlen zu den aufgebrochenen Ringatomen dargestellt

SMILES wurde seit 1988 mehrmals verändert bzw. erweitert. Die aktuelle Definition mit zusätzlicher Information und vielen Beispielen kann unter http://www.daylight.com/smiles/index.html gefunden werden.
Andere verwandte Codierungssprachen sind von SMILES abgeleitet und erweitert worden (XSMILES, SMARTS, SMIRKS, STRAPS, CHUCKLES, CHORTLES, CHARTS). Jede davon wurde für spezielle Moleküldarstellungen entwickelt bzw. erlauben bestimmte Anwendungen (Polymere, Mischungen, Reaktionen oder Datenbankhandling).
Eine besondere Erweiterung von SMILES ist USMILES (z.T. auch als Broad SMILES bezeichnet). Diese "Unique SMILES" ist eine kanonische Darstellung einer Struktur. D.h. dass die Codierung der Struktur unabhängig von der internen Atom-Nummerierung ist. Dies wird durch einen Algorithmus erreicht, der immer dieselbe, kanonische, eineindeutige Beschreibung einer Verbindung ergibt.

Anwendungen

Unter anderem wird SMILES im Daylight Toolkit aber auch in vielen anderen Systemen zur Eingabe von Strukturen verwendet. Diese Möglichkeit hat inzwischen große Bedeutung für chemische Anwendungen im Internet erlangt, da die kompakte Codierung als Text kein graphisches Eingabetool verlangt und zudem eine schnelle Übertragung erlaubt.


© Prof. Dr. J. Gasteiger, Dr. Th. Engel, CCC Univ. Erlangen, Thu Dec 18 14:53:53 2003 GMT
navigation BMBF-Leitprojekt Vernetztes Studium - Chemie