[Prev] [Next] [Home DissOnline]


6.5. Definitionsmöglichkeiten der Reaktionssubstruktur

6.5.1. Lineare, verzweigte und ringförmige Reaktionssubstrukturen

Eine der Forderungen an den Reaktionsgenerator von EROS7 war, zu gewährleisten, daß auch verzweigte und ringförmige Reaktionssubstrukturen behandelt werden können. Eine Reaktionssubstruktur ist die Definition des Reaktionszentrums einer Reaktion. Für eine SN2-Reaktion besteht die Reaktionssubstruktur aus zwei Teilzentren mit insgesamt drei Atomen, wie in Abbildung 78 gezeigt ist.

Abbildung 78: Reaktionssubstruktur der SN2-Reaktion.

Das erste Teilzentrum der SN2-Reaktion aus Abbildung 79 besteht nur aus einem Atom, dem nukleophilen Zentrum Atom 1. Dies kann ein angreifendes Chloridion sein, aber auch das Sauerstoffatom eines angreifenden Ethanolatanions. Atom 2 ist das Kohlenstoffatom, an dem die Substitution stattfindet und Atom 3 ist ein abgehendes Jodatom oder auch das Sauerstoffatom einer abgehenden Tosylatgruppe. Alle Atome in den Resten an den Atomen 1, 2 und 3 sind für die Beschreibung der SN2-Reaktion unerheblich. Die Beschreibung der SN2-Reaktion sieht dann folgendermaßen aus:

Abbildung 79: Reaktionsbeschreibung der SN2-Reaktion mit einem Beispiel.

Die SN2-Reaktion ist ein einfaches Beispiel für eine Reaktionssubstruktur. Auch die Teilschritte komplexerer Reaktionen sind in der Regel nicht viel komplizierter, man möchte aber meist das Reaktionsnetzwerk nicht aus Reaktionsteilschritten aufbauen, sondern aus ganzen Reaktionen. Für die Gesamtreaktionen werden die Reaktionssubstrukturen häufig deutlich komplexer, wie am Beispiel der Bildung von substituierten Pyrazolen aus einer 1,3-Dicarbonylverbindung und einem substituierten Hydrazin zu sehen ist [56] (siehe Abbildung 80). Diese Reaktion besitzt zwei verzweigte Teilsubstrukturen in der Reaktionssubstruktur.

Abbildung 80: Verzweigte Reaktionssubstruktur zur Bildung des Pyrazols. Die Reaktionssubstruktur ist grau unterlegt.

Als eine logische Erweiterung der verzweigten Reaktionssubstrukturen sind auch ringförmige zugelassen.

6.5.2. Mehrere Teilsubstrukturen

Eine weitere Beschränkung bei der Wahl der Reaktionssubstruktur des Vorläuferprogramms EROS6 war, daß maximal drei Teilzentren in der Reaktionssubstruktur enthalten sein durften. Beim neuen Reaktionsgenerator gibt es keine Beschränkung der Zahl der Teilzentren mehr. Dies ist durch die neue Methode der Kodierung der Reaktionssubstruktur (siehe 6.5.3) möglich. Da oft nur die beiden Atome an den Enden eines -Systems Teil des Reaktionszentrums sind, wird zur Kodierung der Reaktionstypen auf der chemischen Datenstruktur RICOS teilweise eine größere Zahl von Teilzentren benötigt. Die beiden Endatome sind zwei Teilzentren, die ein gemeinsames -System verbindet. Die Zahl der dazwischenliegenden Atome ist so ohne Bedeutung. In EROS6 mußte man für alle verschiedenen Abstände der Atome eine eigene Regel schreiben, hatte allerdings nur ein zusammenhängendes Teilzentrum.

Besitzt die Reaktionssubstruktur nur ein Teilzentrum, gibt es keine intermolekularen Reaktionen. Mit zunehmender Zahl an Teilzentren nimmt die Komplexität der Angabe, welches Teilzentrum in welchem Molekül sein muß, stark zu. Deshalb gibt es beim neuen Reaktionsgenerator auch keine Angabe mehr, ob die Reaktion intra- und/oder intermolekular zugelassen ist. Stattdessen werden bei den Bedingungen für die Reaktionssubstruktur die Moleküle überprüft, in denen die einzelnen Teilsubstrukturen gefunden wurden. Der Regelschreiber hat dann alle Möglichkeiten der Verknüpfung und teilt EROS7 nur mit, ob die gefundene Reaktionssubstruktur akzeptiert wird oder nicht.

Da nun gegenüber EROS6 beliebig viele, verzweigte und auch ringförmige Reaktionssubstrukturen (siehe 6.5.1) als Reaktionszentrum definiert werden können, gibt es diesbezüglich keine Beschränkungen mehr.

6.5.3. Suche der Reaktionssubstruktur (RSS)

Die Reaktionssubstruktur, also die Definition des Reaktionszentrums, wird schrittweise in den Strukturen der Edukte gesucht. Ist noch kein Atom in der RSS, wird mit allen Atomen im Ensemble begonnen. Für alle weiteren Atome in der RSS werden alle Atome gesucht, die die in der RSS definierten Nachbarschaften aufweisen. Damit die Definition der RSS unabhängig von der Implementation der chemischen Datenstruktur ist, ist sie über die Nachbarschaft definiert. Ist keine Nachbarschaft für das nächste Atom angegeben, werden wieder alle Atome des Ensembles verwendet.

Abbildung 81: Beispiel, wie die RSS über die Nachbarschaften definiert wird.

Als nächstes werden aus der Liste der möglichen Atome diejenigen herausgenommen, die schon in der RSS enthalten sind. Die verbleibenden Atome werden dann nach ihrer Äquivalenz sortiert. Von jeder Gruppe äquivalenter Atome wird dann eines genommen und für die erweiterte RSS werden die Bedingungen überprüft. Da die Atome in der Reihenfolge 1, 2, 3, usw. gesucht werden, sollten die am meisten diskriminierenden Atome nach Möglichkeit die niedrigsten Nummern erhalten. Ist festgelegt, daß das Atom 2 in Abbildung 81 ein Chloratom sein soll, und enthalten die Ausgangsmaterialen nur vereinzelt Chloratome, empfiehlt es sich aus Geschwindigkeitsgründen die Atome der RSS bei der Erstellung der Regeln so durchzunumerieren, wie es in Abbildung 82 gezeigt ist.

Abbildung 82: Gegenüber Abbildung 81 optimierte RSS.

6.5.4. Symmetriezahl der Reaktion

Gleichzeitig mit dem Wachsen der Zahl der gefundenen Atome in der RSS wird die Symmetriezahl der Reaktion als Produkt aller Größen der Gruppen identischer Atome berechnet.

Abbildung 83: Zwei Moleküle Buta-1,3-dien für eine Diels-Alder-Reaktion mit Angabe der Äquivalenzklassen der Atome.

In Abbildung 83 sind zwei Moleküle Buta-1,3-dien mit den Äquivalenzklassen der Atome gezeigt, mit denen eine Diels-Alder-Reaktion durchgeführt werden kann. Die Suche wird an einer zufälligen Stelle begonnen. Sie soll im linken, als Dien verwendeten Molekül mit dem unteren Atom der Äquivalenzklasse 3 begonnen werden. Hiervon gibt es insgesamt vier identische Atome im Ensemble. Nur für die Atome der Äquivalenzklasse 3 werden die Bedingungen für das erste Atom in der RSS erfüllt sein, daß es sich um ein Atom am Ende eines -Systems handelt. Bei einer MO-orientierten Reaktionsgenerierung benötigt man aus dem Dien nur die beiden Endatome des -Systems. Es werden also für das zweite Atom in der RSS wieder alle Atome im Ensemble betrachtet. Dieses liegt am anderen Ende des -Systems im Dien. Auch für dieses sind die Bedingungen nur für Atome der Äquivalenzklasse 3 erfüllt. Sind nun wirklich alle übrigen drei Atome der Äquivalenzklasse 3 identisch? Sie sind identisch, aber nicht gegenüber dem bereits gefundenen Teil der RSS, denn nur eines der drei Atome liegt, wie zu fordern, im gleichen Molekül. Diese Situation ist nicht darauf beschränkt, daß man zwei Moleküle besitzt. Sie kann auch in einem Molekül auftreten, wie Abbildung 84 zeigt.

Abbildung 84: Äquivalenzbetrachtung bei Ethen.

Hat man das mit X gekennzeichnete Wasserstoffatom im ersten Teilzentrum, sind die mit 1 gekennzeichneten restlichen, eigentlich äquivalenten Wasserstoffatome für die RSS nicht gleichwertig. Würde man auch noch die Stereochemie berücksichtigen, wären sie sogar alle verschieden. Bei der Betrachtung, ob äquivalente Atome auch gleichwertig für die Suche der RSS sind, müssen also auch alle Beziehungen (Abstände) zwischen dem hinzukommenden Atom und allen bereits in der RSS enthaltenen Atomen verglichen werden.

Abschließend muß noch die Äquivalenz der Nachbarschaften abgetestet werden, was am Beispiel von Biphenylen in Abbildung 85 zu erkennen ist. Alle Atome in den Substrukturen sind äquivalent, auch bezüglich ihres Abstands, und dennoch sind die Reaktionssubstrukturen nicht gleich. Berücksichtigt man auch noch die Identität der Nachbarschaft, in die auch die Elektronensysteme zwischen den beiden Atomen und die Ringe, an denen sie beteiligt sind, eingehen, können auch diese Substrukturen unterschieden werden.

Abbildung 85: Biphenylen mit zwei unterschiedlichen Reaktionssubstrukturen.

6.5.5. Bedingungen

Durch die Entscheidung, die Schnittstelle für die Regeln in der Programmiersprache C++ abzufassen, lag es nahe, für die Überprüfung der Bedingungen eine Funktion zu verwenden. Dies eröffnetbei der Abfassung der Regeln auch die ganzen Möglichkeiten der Sprache, in der die Regeln abgefaßt sind, C++ bzw. Tcl. So ist es selbstverständlich, daß die einzelnen Bedingungen auch logisch mit und, oder und nicht verknüpft werden können. Die RSS wird schrittweise gesucht, wobei bei jedem neu gefundenen Atom auch immer gleich die Bedingungen für dieses Atom der RSS überprüft werden. Hierzu stehen eine ganze Reihe von Eigenschaften der chemischen Strukturen zur Verfügung. Die Überprüfung der Bedingungen wird für jedes neu gefundene Atom aufgerufen, wobei mit null gefundenen Atomen begonnen wird. Hier können Eigenschaften des gesamten Ensembles, der Aggregate und Moleküle getestet werden. Die Bedingungen werden für die zunehmende Zahl an Atomen in der RSS weiter getestet, wobei auch die Eigenschaften der schon zuvor gefundenen Atome für eine logische Verknüpfung abgefragt und zur Entscheidungsfindung herangezogen werden können.

Neben den physikochemischen Eigenschaften, die aus der chemischen Struktur berechnet werden, gibt es auch die Möglichkeit, den topologischen Abstand zweier Atome zu testen. Der topologische Abstand ist die Zahl der Bindungen, die auf dem kürzesten Weg zwischen den beiden Atomen liegen. Auch der Abstand von Teilsubstrukturen kann so festgelegt werden. Neben diesen Eigenschaften gibt es auch genealogische Variablen, deren Wert nicht aus der chemischen Struktur berechnet werden können und nur mit den Aggregaten während der Reaktionen weitergereicht werden. Sie können während der Reaktionen gegebenenfalls angepaßt bzw. gesetzt werden. Genealogische Variablen gibt es für Atome, Elektronensysteme, Gruppen, Moleküle und Aggregate. Da EROS7 intern die einzelnen Aggregate getrennt voneinander speichert, können in EROS7 keine genealogischen Variablen für das gesamte Ensemble eingesetzt werden, was allerdings keine Einschränkung sein sollte, da die Werte auch bei den Aggregaten gespeichert werden können. Die genealogischen Variablen können auch definieren, daß äquivalente Teile eines Moleküls in einer bestimmten Hinsicht doch nicht äquivalent sind, beispielsweise eine Markierung als Rest, der durch die Reaktionen nicht verändert werden darf, oder ein Zähler der Umlagerungen, an dem das Atom schon beteiligt war. Um auch EROS7 mitzuteilen, daß diese genealogische Variable die chemische Struktur bezüglich der Reaktionen modifiziert, erklärt man bei der Anmeldung der genealogischen Variablen, daß sie für die Berechnung des Hashcodes [55] verwendet werden soll. Der Hashcode wird für die Erkennung der Äquivalenz von Strukturen und Strukturteilen eingesetzt.

Verwendet man eine genealogische Variable für die Aggregate, in der man speichert, welche Reaktion das betrachtete Aggregat erzeugt hat, kann man auch festlegen, daß nach einer Reaktion des Typs X eine Reaktion des Typs Y oder Z folgen muß, dies aber kein anderer Reaktionstyp in den Regeln sein darf. Auf diese Weise kann die Abfolge von Reaktionstypen gesteuert werden.

Abbildung 86: Nur die Reaktionstypen Y und Z, aber nicht W, sind nach dem Reaktionstyp X zugelassen.

6.5.6. Optionale Atome

Neben der Reaktionssubstruktur (RSS) selbst ist man oft auch an deren Nachbarschaft interessiert. Sie kann nicht Teil der RSS selbst sein kann, da die Reaktion auch bei Abwesenheit der Atome in der Nachbarschaft der RSS ablaufen soll. Holen wir uns das Beispiel der SN2-Reaktion noch einmal ins Gedächtnis und betrachten die Abgangsgruppe (siehe Abbildung 87). Es kann sich um Jodid oder auch Tosylat handeln. Im Fall von Jodid ist das Atom 3 in der RSS nur ein einziges Atom, während bei Tosylat ein größerer Rest am Atom 3 hängt. Da im Fall von Jodid kein weiteres Atom im Edukt an das Jodatom gebunden ist, die Reaktion aber ablaufen soll, kann kein weiteres Atom in die RSS aufgenommen werden. Ohne Betrachtung der Nachbarschaft der RSS läßt sich jedoch nicht ausschließen, daß auch Hydroxidionen als Abgangsgruppen angesehen werden, was man in der Regel allerdings nicht haben möchte (siehe Abbildung 87), da HO- eine sehr schlechte Abgangsgruppe ist. Betrachtet man die Nachbaratome des Atoms 3 der Abgangsgruppe, läßt sich jedoch leicht feststellen, daß es sich um eine Hydroxidgruppe handelt, worauf die Reaktion verworfen werden kann.

Abbildung 87: Hydroxid wird als Abgangsgruppe der SN2-Reaktion ausgeschlossen.

Um dies zu ermöglichen, steht das gesamte Reaktionsensemble zur Abfrage von Eigenschaften zur Verfügung. Für den Zugriff auf die Atome in der RSS fragt man zunächst die Nummer des Atoms im Ensemble für das Atom in der RSS ab. So erhält man beispielsweise, daß das Atom 3 in der RSS den Index 12 besitzt. Das Atom 12 ist also das Atom, an das der Rest der Abgangsgruppe gebunden ist. Um die Eigenschaften des Atoms 3 in der RSS zu erhalten, werden nun die Eigenschaften des Atoms 12 abgefragt. So läßt sich auch die Identität des Wasserstoffatoms (eines optionalen Atoms), das im Fall von Hydroxid dem Sauerstoffatom in der Abgangsgruppe benachbart ist, oder eine andere Eigenschaften überprüfen.



[Prev] [Next] [Home DissOnline]


Hoellering@CCC.Chemie.Uni-Erlangen.DE
Copyright © 1998, Höllering Universität Erlangen-Nürnberg. All rights reserved.