Previous PageNext Page


Organische Reaktionen mit Hilfe neuronaler Netze klassifiziert: Michael-Additionen, Friedel-Crafts-Alkylierungen durch Alkene und verwandte Reaktionen **

Lingran Chen und Johann Gasteiger *

Organische Reaktionen werden durch viele Faktoren beeinflußt: durch die Struktur der Ausgangsmaterialen, den Reagentien und Katalysatoren sowie die Reaktionsbedingungen, z.B. Temperatur, Lösungsmittel, Druck und Licht. Jeder dieser Faktoren kann als eine Koordinate betrachtet werden, die gemeinsam einen mehrdimensionalen Raum aufspannen, und in diesem Sinne ist eine chemische Reaktion ein Ereignis in einem solchen mehrdimensionalen Raum. Chemiker haben ihr Wissen über organische Reaktionen zum großen Teil aus Beobachtungen an Serien von Reaktionen gewonnen, indem sie nach Gemeinsamkeiten und Unterschieden suchten und so Reaktionen in Klassen einteilten, die meist nach ihren Entdeckern benannt wurden, wie Wittig-Reaktion, Michael-Addition oder Beckmann-Umlagerung. Natürlich kann solch ein eindimensionales Klassifizierungsschema nur ungenügend den vielfältigen Beobachtungen bei chemischen Reaktionen Rechnung tragen.
Wir zeigen nun, daß ein Satz chemischer Reaktionen durch ein selbstorganisierendes neuronales Netz in eine zweidimensionale Karte projiziert werden kann. Eine Reaktion entspricht dann einem Punkt in einer solchen Karte, und der Abstand zweier Punkte spiegelt den Grad der Ähnlichkeit der zugehörigen Reaktionen wider. Je nachdem in welcher Richtung in eine solche zweidimensionale Karte projiziert wird, lassen sich unterschiedliche Arten von Ähnlichkeiten darstellen.
Das menschliche Gehirn erzeugt zweidimensionale Karten im visuellen, auditiven oder somatosensorischen Kortex aus sensorischen Informationen der Umgebung. Das selbstorganisierende neuronale Netz nach Kohonen [1] nimmt diese Fähigkeit des menschlichen Gehirns als Vorbild [2]. In ihm sind die Grundelemente, die künstlichen Neuronen, in zwei Dimensionen angeordnet, so daß "Landkarten" der analysierten Daten erhalten werden.
Organische Reaktionen überstreichen einen gewaltigen Bereich an Variationen, und eine Karte, die dieses breite Spektrum an Möglichkeiten widerspiegelt, müßte sehr groß sein. Um die Leistungsfähigkeit unserer Methode zu veranschaulichen, beschränken wir uns deshalb auf einen Satz an Reaktionen, die ein wichtiges Charakteristikum gemeinsam haben: das Reaktionszentrum, d.h. die Atome und Bindungen, die direkt am Bindungsumordnungsprozeß teilnehmen. Wir entscheiden uns für die Addition einer C-H-Bindung an eine C-C-Doppelbindung. Damit sind so bedeutende Reaktionstypen wie Michael-Additionen, Friedel-Crafts-Alkylierungen durch Alkene und die Addition freier Radikale an Alkene erfaßt. In Tabelle 1 ist in der Kopfzeile das Reaktionszentrum dargestellt.
120 Reaktionen wurden bei einer Suche mit dem Reaktions-Retrieval-System ISIS Host [3] in der Version von 1991 der Reaktionsdatenbank ChemInform-RX erhalten [4]. Da die Änderungen in der Struktur des Ausgangsmaterials von ausschlaggebendem Einfluß auf eine chemische Reaktion sind, haben wir uns auf die Untersuchung des strukturellen Einflusses konzentriert. Die Frage war, wie sollten die Strukturen kodiert werden? Offensichtlich kann eine Liste von funktionellen Gruppen um das Reaktionszentrum nicht die Methode der Wahl sein, da diese Liste sehr umfassend sein müßte. Die Chemiker haben das Problem, unterschiedliche funktionelle Gruppen zu vergleichen, bereits angegangen und deren Einfluß mit Konzepten wie Partialladung, induktiver/Feld-, Resonanz- oder Polarisierbarkeitseffekt verallgemeinert. Methoden für die empirischen Berechnung dieser Effekte sind in unserer Gruppe entwickelt worden [5]-[8] und wurden eingesetzt, um den Einfluß funktioneller Gruppen auf die Atome des Reaktionszentrums zu berechnen. Dabei wurden bei den Atomen C-1 und C-3 die s- und p-Elektronegativitäten cs bzw. cp betrachtet, bei den Atomen C-2 und C-3 die Gesamtladungen qtot und beim Atom C-3 die effektive Polarisierbarkeit ai (siehe Tabelle 1).

Diese sieben Variablen wurden zur Beschreibung jeder einzelnen Reaktion des Datensatzes und somit als Eingabe in das neuronale Kohonen-Netz verwendet. Dieses projizierte dann den siebendimensionalen Raum in eine Karte aus 12x12 Neuronen.
Jedes Neuron hat so viele Gewichte, wie es Eingabevariablen für das beschriebene Objekt gibt, in unserem Fall also sieben. Eine Reaktion s wird in dasjenige Neuron c projiziert, dessen Gewichte wji ihren Eingabedaten xsi am ähnlichsten sind [Gl.(a)].

(a)

Nach jeder Eingabe einer Reaktion wurden die Gewichte aller Neuronen den Eingabewerten dieser Reaktion angeglichen. Die Änderungen sind dabei für das Gewinnerneuron c am größten und nehmen mit zunehmendem Abstand von diesem ab. Reaktionen mit ähnlichen elektronischen Faktoren werden daher in das gleiche oder in nah benachbarte Neuronen abgebildet. In unserem Fall erhielt eine Reihe von Neuronen mehrere Reaktionen (bis zu 5), was das hohe Maß an Ähnlichkeit bei diesen Reaktionen aufzeigt. Einer erheblichen Zahl an Neuronen (78) wurde überhaupt keine Reaktion zugewiesen.
Um die Ergebnisse dieser Selbstorganisation von 120 Reaktionen in einem Kohonen-Netz zu veranschaulichen, wurden die Reaktionen von Chemikern den Reaktionstypen zugeordnet und diese durch Symbole charakterisiert (Tabelle 2). Die Neuronen wurden dann mit diesen Symbolen markiert, um zu zeigen, welche Reaktionen in welche Neuronen projiziert wurden. Die Ergebnisse sind in Abbildung 1 dargestellt.

Tabelle 2. Identifizierte Reaktionstypen mit den in Abb. 1 verwendeten Symbolen und der Zahl an Reaktionsbeispielen.

Abb. 1. Kohonen-Karte zur Klassifizierung von 120 Reaktionen. Leere Kästchen stehen für leere Neuronen, durchgekreuzte für Konfliktneuronen. Die Bedeutung der übrigen Symbole ist in Tabelle 2 erklärt.

Ziemlich viele Neuronen enthalten mehrere Reaktionen, die immer vom gleichen Typ sind. Dies unterstreicht die Leistungsfähigkeit des Kohonen-Netzes, die Ähnlichkeit von Reaktionen zu erkennen. Nur ein einziges Neuron, das Neuron (12,1), enthält einen Widerspruch, da ihm sowohl eine Kondensationsreaktion zugeordnet wurde als auch eine Reaktion, die in der Datenbank mit einem falschen Reaktionszentrum bezeichnet wurde.
Bei den meisten Beispielreaktionen handelt es sich um Michael-Additionen, so daß das Kohonen-Netz logischerweise für diesen Reaktionstyp die größte Fläche vorbehält. Die Spezialfälle und die Reaktionstypen mit nur wenigen Beispielen wurden stärker an den Rand der Karte geschoben. Es ist beachtlich, daß die von einem Chemiker zugeteilten Reaktionstypen auch von einem Kohonen-Netz erkannt werden, das als Zuordnungskriterium physikochemischen Variablen der
Reaktionszentren der einzelnen Reaktionen nutzt.
Innerhalb des Gebietes eines Reaktionstyps enthält die genaue Stelle, an der sich eine Reaktion befindet, noch eine Menge an weiterer chemischer Information. Abbildung 2 zeigt den Teil der Karte von Abbildung 1, in dem sich die Michael-Additionen befinden. Zusätzliche Symbole geben hier weitere Details zu den Reaktionen an. Reaktionen, die eine (keine zusätzliche Bezeichnung), zwei(2Z) und drei(3Z) elektronenziehende Gruppen an der reagierenden C-H- Bindung enthalten, sind recht gut voneinander getrennt. Genauso werden die Reaktionen, bei denen die C=C-Bindung zwei stark elektronenziehende Gruppen trägt (*), von denen räumlich getrennt, die nur eine derartige Gruppe enthalten (kein *). Eine zweidimensionale Karte bietet weiterhin die Möglichkeit, Strukturänderungen an beiden reagierenden Bindungen, der C-H- und der C=C-Bindung, gleichzeitig Rechnung zu tragen. Außerdem findet man innerhalb eines Reaktionstyps wie der Michael-Addition die spezielleren Beispiele (S in Abb. 2) an den Randgebieten der Karte.

Abb. 2. Detailliertere Analyse der Gruppe der Michael-Additionen in der Kohonen-Karte von Abb. 1. Die mit 2Z und 3Z gekennzeichneten Neuronen enthalten Michael-Additionen, bei denen die reagierenden C-H- Bindungen durch zwei bzw. drei stark elektronenziehende Gruppen aktiviert werden. Die mit * markierten Neuronen weisen auf Michael-Additionen hin, bei denen die reagierende C=C-Bindung durch zwei stark elektronenziehende Gruppen aktiviert wird. Die mit S gekennzeichneten Neuronen enthalten spezielle Michael-Additionen.

Einige der spezielleren Michael-Additionen werden im folgenden näher vorgestellt. Schema 1 zeigt die Reaktionen, die den Neuronen (6,1), (3,7), (3,12) und (12,12) zugeordnet wurden. Während die meisten Michael-Additionen von einer C-H-Bindung ausgehen, die durch die Gruppen mit einem -M-Effekt aktiviert wird, wird bei den drei Reaktionen, die in das Neuron (6,1) projiziert wurden, das Carbanion durch drei Substituenten mit einem -I-Effekt stabilisiert [9]. Die zwei Reaktionen im Neuron (3,7) haben die Besonderheit, daß eine CH3-Gruppe reagiert, die durch eine Esterfunktion aktiviert wird, die ihren Einfluß durch Konjugation über eine Doppelbindung ausübt [10]. Bei der Reaktion, die das Neuron (3,12) enthält, wird ebenfalls eine CH3-Gruppe durch Konjugation aktiviert, hier allerdings durch eine Nitrogruppe über einen Benzolring [11]. Die Reaktionen in den Neutronen (3,7) und (3,12) sind beide durch eine CH3-Gruppe charakterisiert, die durch konjugativ elektronenziehende Gruppen aktiviert wird, jedoch wird dieser Effekt über unterschiedliche -Elektronensysteme übertragen. Es befriedigt, daß diese beiden speziellen Michael-Additionen in ähnliche Regionen der Karte gelangen.

(6,1):

(3,7):

(3,12):

(12,12):

Schema 1. Die Michael-Additionen, die in die Neuronen (6,1), (3,7), (3,12) und (12,12) projiziert wurden; die getrichelten Bindungen geben die in der Reaktion gebrochenen und geknüpften Bindungen wieder.

Die Reaktion im Neuron (12,12) [12] ist die einzige Michael-Addition in diesem Satz an Reaktionen, bei der eine Csp-H-Bindung reagiert; in allen anderen Fällen ist eine Csp3-H-Bindung beteiligt. Diese Reaktion erweitert also den Bereich der Michael-Additionen und wird folgerichtig im Randbereich des Reaktionstyps abgelegt.
Eine der aufregendsten Eigenschaften des Kohonen-Netzes ist, daß es nach der Reaktionsklassifizierung automatisch chemisches Wissen aus diesen Reaktionsbeispielen erworben hat. Folglich kann das "trainierte" Netz auch eingesetzt werden, um den Reaktionstyp einer unbekannten Reaktion vorherzusagen. Um dies zu verdeutlichen, wurden die 120 Beispielreaktionen in zwei Gruppen aufgeteilt: Die 60 Reaktionen mit ungeraden Indices (siehe Tabelle 2) wurden als Trainingssatz verwendet, die übrigen 60 als Testsatz. Das Ergebnis ist recht eindrucksvoll: Die Reaktionstypen von 95 % der Reaktionen aus dem Testsatz (57 Beispielen) wurden korrekt vorhergesagt. Der Grund für zwei nicht eindeutig und eine falsch zugeordnete Reaktion ist sehr einfach: Es gibt kein Beispiel für diese drei speziellen Reaktionen im Trainingssatz. Sie wurden folgerichtig in leere Neuronen am Rand abgelegt.
Zweidimensionale Kohonen-Karten können die Beziehungen zwischen den untersuchten chemischen Reaktionen aufzeigen, die wichtigen Reaktionstypen herausholen, deren Geltungsbereich darstellen und außerdem auf ungewöhnliche Reaktionen hinweisen. Sie ermöglichen es dem Chemiker, seine Beobachtungen über chemische Reaktionen in einer intuitiv ansprechenden und chemisch wichtigen Art und Weise zu ordnen.

Eingegangen am 6. Oktober 1995 [Z8450]

Stichworte: Kohonen-Karte · Michael-Additionen · Neuronale Netze · Reaktionsklassifizierung

Previous PageNext Page

Johann.Gasteiger@chemie.uni-erlangen.de