Einführung
	Graphentheorie Grundlagen
	Graphentheorie-Chemie
	Adjazenz-Matrix
	Distanz-Matrix
	Inzidenz-Matrix
	Bindungs-Matrix
	Bindungs-Elektronen-Matrix
	Beurteilung Matrizen
	Bindungsliste I
	Bindungsliste II
	Bindungsliste III
	Kanonisierung
	Morgan Algorithmus
	Morgan - Tutorial
	Fragment-Kodierung
	Fingerprints
	Hashcode
	Beurteilung Spezialnotationen

	Oberflächen
	Literatur

Repräsentation chemischer Reaktionen

Daten/Datenformate

Datenbanken/Datenquellen

Struktur-Suchmethoden

Berechnung physikalischer und chemischer Daten

Deskriptoren für chemische Verbindungen

Methoden zur Datenanalyse

Anwendungen

Startseite

Morgan Algorithmus - Tutorial

Im Morgan Algorithmus werden neben der Erzeugung einer eineindeutigen, invarianten Nummerierung der Molekülatome auch konstitutionell äquivalente Atome ausgezeichnet. Der Prozess ist in zwei Phasen unterteilt: ein Relaxations-Prozess, der die erweiterten Konnektivitäten (Extended Connectivities (EC)) berechnet und die Zuordnung der Reihenfolge der Atomnummern.

1. Phase: Klassifizierung der Atome unter Berücksichtigung der Nachbarschaft (Relaxations-Prozess)

Im ersten Iterationsprozess wird jedem Atom eine Zahl (Klasse) zugeordnet, die der Anzahl der gebundenen Nachbarn entspricht (in organischen Strukturen korreliert die Zahl mit den 4 Klassen der primären bis quartären Kohlenstoffatomen). Da diese Information für eine eindeutige Codierung nicht ausreicht, bezieht Morgan Algorithmusn einer weiteren Sphäre die Nachbarschaft des jeweiligen Atoms mit ein, indem alle angrenzenden Klassen aufsummiert werden. Der neue EC-Wert des betrachteten Atoms drückt dadurch indirekt die Nachbarschaft der angrenzenden Atome in einer zweiten Sphäre aus.

Relaxations-Prozess im Morgan-Algorithmus

In jedem Iterationsschritt erfolgt ein Sphärenzuwachs. Dieser Prozess wird so lange weitergeführt bis die Anzahl der unterschiedlichen EC-Werte gleich oder kleiner der Anzahl der EC-Werte des vorigen Iterationsschritts ist.

Der allgemeine Algorithmus ist:

Der erweiterte Konnektivitäts-Wert (EC-Wert) eines Atoms der ersten Sphäre (1) resultiert aus der Anzahl (n) der benachbarten Atome (NA):
EC(1) = n NA(1)
Der EC-Wert wird für jedes Atom berechnet.
Wenn alle EC-Werte der Atome berechnet wurden, wird die Anzahl der Äquivalenzklassen (c) in der ersten Sphäre bestimmt. Diese ist gleich der Anzahl der unterschiedlichen EC-Werte.
In der zweiten und jeder höheren Sphäre (i) wird der EC-Wert jedes Atoms berechnet, indem die EC-Werte der direkt benachbarten, gebundenen Atome der vorigen Sphäre aufsummiert werden:
EC(i) = n NA(i)
In jeder Sphäre wird die Anzahl der Äquivalenzklassen (c) bestimmt.
Die Iteration wird solange fortgesetzt bis die Anzahl der Äquivalenzklassen kleiner oder gleich der vorigen Iteration ist.
Der Iterationsschritt mit der höchsten Anzahl an Äquivalenzklassen wird in der 2. Phase weiter verarbeitet.

Relaxations-Prozess: Klassifizierung

Die EC-Werte der Atome in Phenylalanin (ohne Wasserstoffatome) werden unter Berücksichtigung der Äquivalenzklassen der Nachbarschaftatome berechnet. Nach jedem Relaxations-Prozess wird die Anzahl der Äquivalenzklassen c bestimmt.

2. Phase: Zuordnung einer eineindeutigen, invarianten Zahlenreihe zu den Atomen

Ist im Relaxations-Prozess die Iteration mit der höchsten Anzahl an Äquivalenzklassen erreicht worden, wird diese Stufe als Startpunkt für die Kanonisierung verwendet.

Das Atom mit dem höchsten EC-Wert bekommt die Nummer 1 zugewiesen (und ist jetzt das bezugnehmende Atom).
Alle benachbarten, gebundenen Atome werden entsprechend ihren sinkenden EC-Werten mit 2, 3 und 4 beziffert. Falls zwei oder mehr Atome den gleichen EC-Wert haben, werden die Atome aufgrund folgender Regeln durchnummeriert: Atomtypen (C vor N) oder Bindungstypen (Einfach- vor Doppelbindungen), Ladungen, etc.
Im nächsten Schritt wird nun das Atom mit der nächsthöheren Zahl das bezugnehmende Atom. Alle unnummerierten Atome, die mit diesem verbunden sind, werden wieder entsprechend ihrer sinkenden EC-Werte durchnummeriert. Wie in 2. Punkt werden Atome mit gleichem EC-Wert nach definierten Regeln nummeriert.
Dieser Prozess wird fortgesetzt, bis alle Atome kanonisch nummeriert worden sind.

Kanonisierung im Morgan Algorithmus

Kanonisierung im Morgan Algorithmus

Der Morgan Algorithmus konzentriert sich somit auf das "eingebetteste" Atom der Struktur und beginnt dort mit der eindeutigen Nummerierung.
Basierend auf dem Morgan Algorithmus sind viele Erweiterungen eingeführt worden, um die Probleme wie z.B. oszillierende Klassifizierungszahlen oder spezielle Atome mit isospektralen Punkten zu beheben.

BMBF-Leitprojekt Vernetztes Studium - Chemie