[Top] [Prev] [Next] [Bottom]
Diese Arbeit ist Teil der Dissertationen unter http://www2.chemie.uni-erlangen.de/services/dissonline/


7. Konvertierung zwischen RICOS und dem VB-Modell

Das RICOS-Modell erlaubt es, chemische Strukturen auf einfache Weise zu beschreiben, die im VB-Modell nur unter Schwierigkeiten dargestellt werden können. Neuentwickelte Programme, z. B. zur Reaktionsvorhersage, können von dieser verbesserten Darstellungsform chemischer Strukturen profitieren. Zusätzlich müssen aber auch bestehende Programmsysteme, die auf einer herkömmlichen Strukturdarstellung beruhen, zusammen mit diesen Neuentwicklungen benutzt werden können. Desweiteren gibt es große Sammlungen von Strukturen, Reaktionen oder Spektren, die zugänglich bleiben müssen. Aus diesen Gründen wurden Algorithmen entwickelt, um zwischen den beiden Strukturrepräsentationen konvertieren zu können. Diese Verfahren können einerseits dazu benutzt werden, Dateiformate, die auf gebräuchlichen Bindungslisten beruhen, zu lesen bzw. zu schreiben. Andererseits ist es aber auch möglich, Programmcode, der noch nicht auf die neue Darstellungsform umgestellt wurde, direkt in Neuentwicklungen einzubinden. Dies war z. B. im Fall der Berechnung physikochemischer Eigenschaften nötig (siehe Kapitel 5.5 ).

7.1. Umwandlung von Molekülen mit VB- Repräsentation in RICOS

Die Konvertierung von Strukturen in das RICOS-Format unterliegt einigen Einschränkungen, die ihre Ursache in Unzulänglichkeiten der VB-Darstellung haben. Die Beschreibung von Komplexverbindungen oder Verbindungen mit Mehrzentrenbindungen mit Hilfe herkömmlicher Bindungslisten ist schwierig und es gibt keine allgemeinen Regeln, wie diese Strukturen in Bindungslisten repräsentiert werden sollen. Aus diesem Grund können Verbindungen mit Komplex- oder Mehrzentrenbindungen nicht in das RICOS-Modell konvertiert werden. Desweitern lassen sich Bindungslisten in Bezug auf Konjugation innerhalb von orthogonalen -Systemen nicht immer eindeutig interpretieren. Daher müssen Annahmen über die Natur der Konjugation in delokalisierten Verbindungen gemacht werden, die zu einer möglichst sinnvollen Repräsentation in RICOS führen und zudem unabhängig von der vorgegebenen Resonanzstruktur und der Numerierung der Atome die gleiche RICOS-Repräsentation ergeben. Folgende Vorgaben müssen bei der Ableitung der Konjugation beachtet werden.

Tab. 7-1: Regeln zur Kombination benachbarter Elektronensysteme bei der Ableitung konjugierter -Elektronensysteme. nV bezeichnet die Anzahl der -Elektronensysteme des Vaterknoten, nS die des Sohns.

nV nS Aktion

0 0 - 3 keine Aktion erforderlich

0 - 3 0
1 1 kombiniere beide Systeme

1 2,3 kombiniere das einzelne System mit dem größten der zur Auswahl
stehenden Systeme

2, 3 1
2 2 kombiniere jeweils die beiden größten und die beiden kleinsten Systeme

2 3 kombiniere jeweils die beiden größten sowie die beiden zweitgrößten Systeme

3 2
3 3

Für Thiophen sind beide Stufen der Konvertierung in Abbildung 7-1 a dargestellt. Zunächst werden die beiden Doppelbindungen im Ring in zwei -Elektronensysteme aus jeweils zwei Atomen mit zwei Elektronen umgewandelt. Das sp2-hybridisierte Schwefelatom erhält zwei gefüllte und fünf leere -Elektronensysteme, um die vollständige Zahl von neun Elektronensystemen zu erzeugen. Im zweiten Schritt findet die Tiefensuche statt. Abbildung 7-1 b zeigt zwei Schritte dieser Suche im Molekülgraphen von Thiophen. Im linken Teil der Abbildung ist Atom 2 der Vaterknoten, Atom 3 der Sohnknoten. Da beide Atome jeweils ein -Elektronensystem besitzen, werden die beiden Systeme nach Tabelle 7-1 kombiniert. Der rechte Teil der Abbildung zeigt ein späteres Stadium der Suche. Hier sind die Atome 4 und 5 der Vater- bzw. Sohnknoten. Der Vaterknoten besitzt wiederum ein, der Sohnknoten diesmal aber sieben -Elektronensysteme. Daher wird das Elektronensystem des Vaterknotens mit dem größten Elektronensystem des Sohnknotens vereinigt. Im Fall des Schwefels ist das größte Elektronensystem eines der beiden freien Elektronenpaare.

Abb. 7-1: Konvertierung der VB-Repräsentation von Thiophen nach RICOS. a) Beide Stufen der Konvertierung, b) 2 Schritte der Tiefensuche im Molekülgraphen von Thiophen.

Im letzten Schritt der Konvertierung werden Atom-, Molekül- oder Ensembleeigenschaften, die unabhängig von der Repräsentation der Elektronen in Bindungen sind, von der VB-Kodierung auf die RICOS-Kodierung übertragen. Dies ist insbesondere für stereochemische Deskriptoren wichtig, die in einer späteren Erweiterung der von RICOS als Atomeigenschaft behandelt werden sollen und daher bei einer Konvertierung nicht verlorengehen dürfen. Aber auch andere Molekül- und Ensembleeigenschaften wie etwa Namen oder Registernummern aus Datenbanken können so mitgeführt werden.

Abbildung 7-2 zeigt das Ergebnis der Konvertierung zweier Verbindungen mit orthogonalen -Elektronensystemen. Für Tolan (Diphenylethin) wird, wie schon angesprochen, ein großes -Elektronensystem, das sich über das gesamte Molekül erstreckt gebildet und eines, das nur die beiden Atome der Alkingruppe enthält. Das zweite Beispiel enthält zwei benachbarte freie Elektronenpaare, die nicht konjugiert werden.

Abb. 7-2: Ergebnisse der automatischen Konvertierung zwischen dem VB-Modell und RICOS für Verbindungen mit orthogonalen -Elektronensystemen.

7.2. Umwandlung von Molekülen in RICOS-Repräsentation in VB-Repräsentation

In der chemischen Literatur hat man sich mit der Bestimmung der Zahl der möglichen Kekulé-Strukturen in konjugierten Molekülen befaßt [65] , [66] , [67] , [68] . Es wurden ebenfalls Algorithmen zur Bestimmung einer kanonischen Kekulé-Struktur für konjugierte Verbindungen entwickelt [66] , [69] , [70] . Diese Algorithmen sind aber für die Aufgabe, Elektronensysteme der RICOS-Repräsentation in Ladungen, freie Elektronen und Mehrfachbindungen zu übertragen, nicht geeignet. Denn sie beruhen auf der Annahme, daß die Zahl der Elektronen des zu lokalisierenden -Systems der Zahl seiner Atome entspricht, daß also jedes Atom an mindestens einer Mehrfachbindung beteiligt ist. In RICOS sind jedoch auch freie Elektronenpaare und geladene Atome, die keine Valenzelektronen in das -Elektronensystem beisteuern, Teil der delokalisierten -Elektronensysteme. Es mußte daher ein neuer Algorithmus zur Verteilung der Elektronen in lokalisierte Bindungen entwickelt werden.

Auch hier mußten Einschränkungen in Bezug auf die Art der konvertierbaren Verbindungen gemacht werden. Es werden wiederum nur solche Verbindungen konvertiert, die reguläre - und -Elektronensysteme enthalten, nicht jedoch Verbindungen mit Mehrzentrenbindungen oder koordinativen Bindungen. Da die interne Datenstruktur zur Kodierung des VB-Modells auch das Konzept der Aggregate und Wechselwirkungsgruppen enthält, ist eine Übertragung von Aggregaten, deren Wechselwirkungsgruppen aus Atomen bestehen, möglich.

7.2.1. Allgemeine Vorgehensweise

Alle Moleküle eines Ensembles oder Aggregats werden zur Konvertierung einem mehrstufigen Prozeß unterworfen. Zuerst wird eine Struktur erzeugt, in der jedes -Elektronensystem durch eine Einfachbindung ersetzt ist. Dabei wird das zu konvertierende Molekül auf Elektronensysteme geprüft, die von der Konvertierung ausgeschlossen sind. Dies sind koordinative Bindungen sowie -Elektronensysteme, die entweder nicht regulär sind, oder eine Elektronenzahl ungleich zwei haben. Enthält ein Molekül ein solches Elektronensystem, wird das Verfahren an dieser Stelle abgebrochen.

Daraufhin werden sukzessive alle -Elektronensysteme des Moleküls behandelt, und die in ihnen enthaltenen Elektronen lokalisiert. Dabei wird jeweils eine Resonanzstruktur gebildet, die die maximal mögliche Zahl an Doppelbindungen enthält, Ladungstrennung wird nach Möglichkeit vermieden. Das Ablaufschema für diesen Prozeß zeigt Abbildung 7-3 . Zunächst wird im aktuellen Elektronensystem die Zahl der Atome mit der Zahl der Elektronen verglichen. Ist die Zahl der Elektronen höher als die Zahl der Atome, so enthält das -Elektronensystem freie Elektronenpaare, ist sie niedriger, so enthält es ein Atom, dem kein Valenzelektron zugeordnet werden darf. Dies sind in der Regel positiv geladene Atome, ungeladen sind nur Atome der dritten Hauptgruppe. Die Differenz zwischen Atom- und Elektronenzahl entspricht der Zahl der Atome, auf denen freie Elektronen oder positive Ladungen lokalisiert werden müssen. Ist sie größer als Null, findet eine Suche nach den günstigsten Atomen statt, die entweder die freien Elektronen oder die positive Ladung tragen können mit der Nebenbedingung, daß am Ende der Konvertierung möglichst wenige Atome eine Formalladung tragen. Im nächsten Schritt werden die Doppelbindungen zwischen den übrigen Atomen verteilt. In einigen wenigen Fällen, in denen dies nicht möglich ist, wird eine Ladungstrennung durchgeführt, das heißt, die Zahl der Atome, die ein freies Elektronenpaar und eine positive Ladung tragen sollen, wird jeweils um eins erhöht. Danach wird der Prozeß beginnend mit der Suche nach geeigneten Atomen zur Lokalisierung der freien Elektronen und Ladungen wiederholt. Die gefundenen Lokalisationsorte werden während der Suche zwischengespeichert.

Wenn in diesem Prozeß alle Elektronen lokalisiert werden konnten, werden die Elektronen und Mehrfachbindungen auf das Bindungsgerüst aus Einfachbindungen übertragen. In einem letzten Schritt werden Atom-, Molekül-, Aggregat- und Ensembleeigenschaften kopiert.

Abb. 7-3: Ablaufschema der Lokalisierung der Elektronen aller -Elektronensysteme eines Moleküls.

7.2.2. Suche nach geeigneten Atomen zur Lokalisierung von Ladungen und freien Elektronen

Zu Beginn der Lokalisierung wird in jedem -Elektronensystem geprüft, ob die Differenz zwischen der Zahl der Atome und der Zahl der Elektronen des Elektronensystems eine Verteilung freier Elektronen oder Ladungen erfordert. Ist die Ladung positiv, so entspricht sie der Zahl der zu verteilenden positiven Ladungen, ist sie negativ, der Zahl der Atome mit freien Elektronen. Ist die Zahl der Elektronen im System ungerade, so liegt ein Radikal vor. In Verbindungen, die in einem -Elektronensystem sowohl Elemente der dritten Hauptgruppe als auch Elemente der fünften bis siebten Hauptgruppe enthalten, ist es sinnvoll, nicht die maximal möglichen Doppelbindungen zu erzeugen. Dies würde in einer VB-Struktur mit zwei geladenen Atomen resultieren ( Abbildung 7-4 a). Um formal ungeladene Atome zu erhalten, werden für jedes solche Atompaar je ein Atom mit freien Elektronen und ein Atom ohne Valenzelektronen aus diesem -Elektronensystem mehr bestimmt. Daraus resultieren VB-Strukturen wie in Abbildung 7-4 b.

Abb. 7-4: Die Zuordnung zusätzlicher freier Elektronenpaare und Atome ohne Valenzelektronen in -Elektronensystemen mit Atomen sowohl der dritten als auch der fünften bis siebten Hauptgruppe vermeidet Ladungstrennung.

Die Suche nach Atomen, die freie Elektronen oder positive Ladungen tragen sollen, erfolgt iterativ in zwei Stufen. Für jedes Elektronenpaar, Radikal oder positive Ladung werden zunächst alle möglichen Atome gesucht, die für die Plazierung in Frage kommen und danach das günstigste von ihnen ausgewählt.

Die Lage dieser Atome muß so ausgewählt werden, daß bei der nachfolgenden Verteilung der Doppelbindungen keine Biradikale entstehen. Anhand des Bindungsgerüsts, das dem Elektronensystem zu Grunde liegt, wird eine Tabelle angelegt, die für jedes Atom die Abstände zu allen nächst liegenden Endatomen bzw. Verzweigungen enthält, die von diesem Atom erreichbar sind, ohne einen Verzweigungspunkt zu überschreiten. Atome, die freie Elektronen oder positive Ladungen tragen können, werden in der folgenden Diskussion Zentrum genannt. Ein Atom ist dann ein mögliches Zentrum, wenn es einer der folgenden Regeln für die Vergabe dieser Punkte genügt:

1. Ein Atom ist ein Zentrum, wenn die Abstände zu allen Endatomen jeweils gerade und die Abstände zu allen Verzweigungen ungerade sind.

2. Verzweigungspunkte, die Regel 1 nicht genügen, sind auch dann Zentren, wenn sie mindestens zwei Endatome mit einem geraden Abstand besitzen.

3. Ausgehend von Verzweigungen, die nach Regel 1 oder 2 als Zentrum gefunden wurden, werden Atome auch dann berücksichtigt, wenn sie in geradem Abstand zu diesen Atomen liegen.

4. Atome, die mindestens noch zwei freie Elektronen tragen müssen, um formal neutral zu sein, und nicht in ungeradem Abstand zu einem Endatom liegen, werden ebenfalls als Zentren markiert.

5. In isolierten Ringen werden alle Atome als Zentren markiert.

Die vier Verbindungen aus Abbildung 7-5 veranschaulichen diese Regeln. Atome, die nach Regel 1 gefunden werden, sind mit einem Punkt markiert, nach Regel 2 mit einem Quadrat, nach Regel 3 mit einem Dreieck und nach Regel 4 mit einer Raute. Die Zahlen neben jedem Atom geben den Abstand zur nächsten Verzweigung oder zum nächsten Endatom an. In 1 werden zwei Zentren gefunden, die beide Endatome sind und einen ungeraden Abstand zum Verzweigungspunkt besitzen. Das dritte Endatom ist zwei Atome vom Verzweigungspunkt entfernt und wird daher nicht als mögliches Zentrum erkannt. Der Verzweigungspunkt selbst hat einen ungeraden Abstand zu den beiden markierten Atomen und kommt daher ebenfalls nicht für ein Zentrum in Frage. Bei der Suche nach Zentren in 2 kommen Regel 1 und 3 zum Tragen. Ausgehend vom nach Regel 1 markierten Verzweigungspunkt werden auch die beiden Atome, die mit einem Quadrat markiert sind, gefunden. Die Zentren in Verbindung 3 werden durch Anwendung der Regel 2 und 3 gefunden. Zu beiden Verzweigungspunkten gibt es zwei Endpunkte mit geradem Abstand (Regel 3). Das zentrale Atom erfüllt zwar die Regel 1, wird aber aufgrund der Priorität von Regel 2 wieder aus der Liste der in Frage kommenden Atome entfernt, da in Ketten die Distanzen zwischen den beteiligten Atomen gerade sein müssen. Die Endpunkte werden wieder nach Regel 3 gefunden.

Abb. 7-5: Anwendung der Regeln zur Suche von Ladungszentren. Atome, die nach Regel 1 gefunden werden, sind mit einem Punkt markiert, nach Regel 2 mit einem Dreieck, nach Regel 3 mit einem Quadrat, nach Regel 4 mit einer Raute. Die Zahlen zeigen die Abstände der markierten Atome zum nächsten End- oder Verzweigungspunkt.

In Verbindung 4 führt die Anwendung der Regeln 1 und 4 zu drei möglichen Zentren. Die beiden Sauerstoffatome der Carboxylgruppe sind Endpunkte wie diejenigen von Verbindung 1. Das Schwefelatom hat sowohl einen geraden als auch einen ungeraden Abstand zur Verzweigung. Es erfüllt daher Regel 1 nicht. Da es aber mindestens ein freies Elektronenpaar benötigt, um formal ungeladen zu sein, wird es nach Regel 4 markiert.

Die Zahl der noch benötigten freien Elektronen nel an einem Atom ergibt sich wie folgt:

(7-1)

mit Z Ordnungszahl, c Zahl der Kernelektronen, s Zahl der -Elektronensysteme, f Zahl der freien Elektronen, die entweder schon gefunden wurden, oder durch einatomige -Elektronensysteme vorgegeben sind. Für das betrachte Schwefelatom in Verbindung 4 ergibt sich:

(7-2)

Nachdem diese Punkte gefunden wurden, wird das günstigste Atom, das als Zentrum fungieren kann, gesucht. Dabei muß zwischen der Lokalisierung freie Elektronen und positiver Ladungen unterschieden werden, da freie Elektronen bevorzugt an Heteroatomen der höheren Hauptgruppen, positive Ladungen an Kohlenstoffatomen oder anderen Atomen der niedrigeren Hauptgruppen lokalisiert werden sollen. Es werden jeweils verschiedene Faktoren berücksichtigt, die gegeneinander gewichtet werden.

Bei der Plazierung von freien Elektronen sind folgende Faktoren ausschlaggebend: Wenn Atome mindestens zwei freie Elektronen benötigen, um formal ungeladen zu sein, haben sie höchste die Priorität, wobei Atome mit nur einem -Elektronensystem favorisiert werden. Auch Atome höherer Hauptgruppen werden stärker gewichtet. Weniger starken Einfluß auf die Auswahl haben folgende Faktoren, die sich hauptsächlich in reinen Kohlenwasserstoffen auswirken. Zwei Quotienten, die Aussagen über die Umgebung des Atoms machen, sind das Verhältnis aus der Zahl ungeradzahliger Verzweigungen zu allen Verzweigungen sowie aus der Zahl geradzahliger Endatome zu allen Endatomen. Atome mit einem höheren Anteil an ungeradzahligen Verzweigungspunkten sowie mit einem höheren Anteil an geradzahligen Endatomen werden bevorzugt. Der letzte Faktor, der bei der Plazierung berücksichtigt wird, ist die sogenannte erweiterte Konnektivität (engl. extended connectivity ), die auf dem Graphen der noch nicht zugeordneten Atomen des Elektronensystems berechnet wird. Mit ihr werden Atome eines Moleküls in Äquivalenzklassen eingeteilt, äquivalente Atome erhalten den gleichen Wert. Außerdem ist sie auch ein Maß dafür, wie weit im Zentrum eines Moleküls ein Atom liegt. Je zentraler die Lage des Atoms ist, desto höher ist der Wert der erweiterten Konnekivität. Sie wurde schon von Morgan [29] in seinem Algorithmus zur kanonischen Numerierung von Atomen in Molekülen verwendet. Atome am Rand des -Elektronensystems, also mit einem niedrigen Wert für die erweiterte Konnektivität, werden bevorzugt. Zudem wird durch ihre Verwendung garantiert, daß nichtäquivalente Atome, die sich durch die bisher aufgeführten Faktoren nicht unterscheiden, unterschiedlich bewertet werden. Somit ist Numerierungsunabhängigkeit gewährleistet.

Bei der Plazierung von positiven Ladungen werden folgende Kriterien berücksichtigt: Positive Ladungen werden hauptsächlich an Kohlenstoffatomen in -Elektronensystemen ohne Heteroatome lokalisiert, in denen es keine Atome gibt, die aufgrund ihrer Bindungsverhältnisse bevorzugt bei der Zentrenvergabe berücksichtigt werden müssen. Daher wurden die Kriterien so gewählt, daß die Atome in der Mitte des -Elektronensystems höhere Prioritäten erhalten, da dies die spätere Verteilung der Doppelbindungen auf die restlichen Atome des -Elektronensystems vereinfacht. Um das günstigste Atom zu finden, werden die beiden Quotienten, die das Verhältnis von End- und Verzweigungspunkten ausdrücken, und die erweiterte Konnektivität gegeneinander gewichtet. Diesmal werden jedoch Atome mit höherer Werten für die erweiterte Konnektivität bevorzugt.

Die Kohlenstoffatome der Kationen in Abbildung 7-6 werden zu Ladungszentren gewählt, da sie jeweils sowohl die höchste erweiterte Konnektivität besitzen als auch den höchsten Anteil an Verzweigungspunkten in ungeradem Abstand. Nach dieser Zuordnung besteht das -Elektronensystem in Abbildung 7-6 a) nur noch aus einem isolierten Ring, das -Elektronensystem in Abbildung 7-6 b) aus einer unverzweigten Kette. In beiden ist die anschließende Zuordnung von Doppel- und Einfachbindungen am einfachsten.

Abb. 7-6: Zuordnung der positiven Ladung zum Atom mit der jeweils höchsten erweiterten Konnektivität.

7.2.3. Suche nach Doppelbindungen

Durch die Bestimmung der Atome, die freien Elektronen bzw. positiven Ladungen aufnehmen, kann ein -Elektronensystem in mehrere unzusammenhängende Abschnitte gespalten werden. Jeder dieser Abschnitte wird nun der Prozedur zur Verteilung von Doppelbindungen unterworfen. Sie ist in mehrere Schritte unterteilt.

Zunächst wird für jedes noch unbehandelte Atom eines -Elektronensystems bestimmt, wieviele Nachbaratome es in diesem -Elektronensystem hat. Atome mit nur einem Nachbaratom werden im folgenden Endatome genannt, Atome mit drei Nachbaratomen Verzweigungspunkte.

Zunächst werden alle unverzweigten Ketten behandelt, da in ihnen die Verteilung der Doppelbindungen am einfachsten ist. Ausgehend von einem Endatom erhalten alle Atompaare der Kette alternierende Doppel- und Einfachbindungen.

Im nächsten Schritt werden alle verzweigten Ketten und Ringsysteme mit exocyclischen Doppelbindungen behandelt. Die Vorgehensweise wird anhand der Abbildungen 7-7 und 7-8 veranschaulicht. An Verzweigungspunkten ist die Lage der Doppelbindung zwischen dem Verzweigungspunkt und einem seiner Nachbaratome nicht sofort ersichtlich. Daher wird die Bestimmung der Lage der Doppelbindungen von den Endatomen des -Elektronensystems gestartet. Zu diesem Zweck wird zunächst jedem Atom ein Zähler mit dem Startwert 0 zugeordnet. Nun wird die Differenz zwischen der Zahl der Nachbaratome und dem Wert des Zählers gebildet. Wenn sie gleich eins ist, eignet sich das entsprechende Atom als Startatom zur Vergabe von Doppelbindungen. Im ersten Zyklus ist diese Bedingung für alle Endatome erfüllt. Von jedem Startatom ausgehend wird eine rekursive Tiefensuche auf dem Graphen des -Elektronensystems nach alternierenden Doppel- und Einfachbindungen durchgeführt. Das Startatom hat nur einen Nachbarn, zu dem die erste Doppelbindung festgelegt wird. Beide Atome werden als behandelt markiert, indem der Zähler der beiden Atome, die an der Doppelbindung teilhaben, gleich der Zahl der Nachbaratome gesetzt wird. Daraufhin werden alle noch nicht behandelten Nachbarn des zweiten Atoms zu neuen Startatomen für die nächsten Doppelbindungen und dies solange wiederholt bis eines der folgenden Abbruchkriterien greift. Wenn ein Verzweigungspunkt als Startpunkt einer Doppelbindung erreicht wird, wird die Suche an dieser Stelle abgebrochen, und der Zähler für dieses Atom inkrementiert. Trifft die Suche auf ein Atom, für das die Differenz zwischen Zahl der Nachbaratome und dem Wert des Zähler gleich Null ist, so wurde das entsprechende Atom schon behandelt und der Prozeß wird ebenfalls abgebrochen.

Abb. 7-7: Verteilung von Doppelbindungen in verzweigten -Elektronensystemen in einem Zyklus. In a) und b) wurde eine unterschiedliche Reihenfolge der mit einem Punkt markierten Startatome verwendet. Neben den Doppelbindungen, ist die Reihenfolge, in der sie gefunden wurden, angegeben.

Im -Elektronensystem aus Abbildung 7-7 reicht ein Zyklus, in dem alle Endatome als Startatome geprüft werden, aus, um die Lage aller Doppelbindungen zu bestimmen. Wenn das oberste Atom, das in a) mit einem Punkt markiert ist, als erstes Startatom gewählt wird, werden alle Doppelbindungen von diesem Startatom ausgehend in der neben den Doppelbindungen angegebenen Reihenfolge gefunden. Wenn ein anderes Atom als erstes Startatom gewählt wird, z. B. das in b) rechts markierte Atom, so kann von diesem Atom ausgehend nur die erste Doppelbindung festgelegt werden, denn dann trifft die Suche auf eine Verzweigung als Startpunkt und sie wird zunächst abgebrochen. Mit dem obersten Atom als nächstem Startatom können jedoch alle anderen Doppelbindungen festgelegt werden.

Für das verzweigte -Elektronensystem aus 12 Atomen in Abbildung 7-8 reicht jedoch ein Zyklus nicht aus, um alle Doppelbindungen zu bestimmen. Im ersten Zyklus werden nacheinander die mit einem Punkt markierten Atome als Startatome verwendet und dabei die vier terminalen Doppelbindungen gefunden. Im nächsten Zyklus eignen sich diejenigen Verzweigungen als Startatome, deren Zähler im ersten Zyklus zweimal inkrementiert wurde. Dort ist nun die Differenz zwischen Nachbaratomen und Zähler gleich eins ( Abbildung 7-8 b). Zwei der Nachbaratome wurden schon behandelt, die Doppelbindung wird zum noch unbehandelten Atom ausgebildet, und dann wird die Tiefensuche wieder so weit durchgeführt, bis alle Abbruchkriterien erfüllt sind. Es werden so viele Zyklen durchlaufen, bis kein neues Startatom mehr zur Verfügung steht. Das ist entweder der Fall, wenn alle Atome des -Elektronensystems abgearbeitet wurden ( Abbildung 7-8 c), oder wenn das -Elektronensystem Ringsysteme ohne exocyclische Doppelbindungen enthält.

Abb. 7-8: Verteilung von Doppelbindungen in einem verzweigten -Elektronensystem in mehreren Zyklen. Die Startatome der beiden Zyklen sind jeweils mit einem Punkt markiert. Neben jedem Atom ist jeweils die Differenz zwischen der Zahl der Nachbarn und dem Markierungszähler angegeben (Erklärung siehe Text).

Ringe mit exocyclischen Doppelbindungen werden ebenfalls mit dieser Methode behandelt. In Fulven wird das Methylenkohlenstoffatom als Startatom verwendet. Nachdem die erste Doppelbindung zum Verzweigungspunkt hin ausgebildet wird, kann die rekursive Suche für alternierende Einfach- und Doppelbindungen die beiden Doppelbindungen im Ring finden. Es ist in diesem Fall nur ein Zyklus notwendig, um alle Doppelbindungen zu plazieren.

Abb. 7-9: Zuordnung von Doppelbindungen in -Elektronensystemen mit exocyclischen Doppelbindungen am Beispiel von Fulven. Das Startatom ist mit einem Punkt markiert.

In Ringsystemen ohne exocyclische Doppelbindung gibt es keine Startatome mit nur einem Nachbarn, von denen die Lokalisierung ausgehen kann. Daher muß das Startatom zusammen mit dem ersten Nachbarn so ausgewählt werden, daß eine Lokalisierung möglich ist, ohne Biradikale zu erzeugen. Auch hier sind wieder zwei Fälle zu unterscheiden. In isolierten Ringen sind alle Atome als Startatom gleich gut geeignet. Daher werden als die beiden ersten Atome, zwischen denen eine Doppelbindung ausgebildet wird, das erste Atom des Rings sowie dessen erstes Nachbaratom ausgewählt. Auf die übrigen Atome wird die rekursive Suche für alternierende Einfach- und Doppelbindungen angewendet, bis man wieder beim Startatom angelangt ist.

In kondensierten Ringen, oder Ringen, die durch Ketten miteinander verbunden sind, werden die ersten beiden Atome nach einer Heuristik ausgewählt. Das Startatom ist der Verzweigungspunkt mit der höchsten erweiterten Konnektivität, der zugleich Teil eines Rings ist. Das zweite Atom der Doppelbindung ist in Ringsystemen mit einer geraden Anzahl von Atomen das Nachbaratom des Startatoms im Ringsystem mit der niedrigsten erweiterten Konnektivität. In Ringsystemen mit einer ungeraden Anzahl von Atomen wird zunächst geprüft, ob ein exocyclisches Nachbaratom vorhanden ist, und falls nicht, ebenfalls das Nachbaratom im Ringsystem mit der niedrigsten Konnektivität gewählt. Dadurch wird das Ringsystem so geschnitten, daß einerseits eine möglichst lange Kette aus unbehandelten Atomen entsteht, auf der dann eine rekursive Suche nach Doppel- und Einfachbindungen durchgeführt wird. Andererseits wird durch die Auswahl einer Ringbindung in geradzahligen Ringsystemen bzw. einer exocyclischen Bindung in ungeradzahligen Ringsystemen gewährleistet, daß keine Biradikale entstehen. Die Wahl des Atoms mit der niedrigsten erweiterten Konnektivität verhindert ebenfalls die Bildung von Biradikalen.

Abbildung 7-10 zeigt die Anwendung der Heuristik zur Auswahl der Lage der ersten Doppelbindung in kondensierten Ringsystemen und Ringsystemen, die über Ketten miteinander verbunden sind. Die Zuordnungen a) und b) würden jeweils zu Biradikalen führen, die Zuordnungen c) und d) ergeben eine richtige Verteilung der Doppel- und Einfachbindungen. Wenn das -Elektronensystem in a) ausgehend vom Startatom zum Nachbarn mit der höchsten erweiterten Konnektivität geschnitten würde, würden zwei Teile entstehen, die beide aus einer ungeraden Anzahl von Atomen bestehen. Dies wird vermieden, indem die erste Doppelbindung entlang des äußeren Rings festgelegt wird. In b) haben beide Verzweigungspunkte die gleiche erweiterte Konnektivität. Daher ist es numerierungsabhängig, welches Atom als Startatom gewählt wird. Beide führen jedoch zum selben Ergebnis.

Abb. 7-10: Auswahl der Lage der ersten Doppelbindung in kondensierten Ringen und Ringen, die über Ketten verbunden sind. Das Startatom ist jeweils mit einem Punkt markiert, das Nachbaratom mit einem Quadrat. Die Zahlen neben den Atomen geben die erweiterte Konnektivität an.

Ausgehend von den Nachbarn beider Atome der Doppelbindung wird nun wieder die Suche nach alternierenden Doppel- und Einfachbindungen auf dem -Elektronensystem durchgeführt, bis entweder alle Atome behandelt wurden oder Verzweigungspunkte als Startpunkte erreicht werden, die noch mehr als einen unbehandelten Nachbarn besitzen. In diesem Fall wird das nächste Atompaar anhand der Heuristik ausgewählt und dieser Zyklus so oft wiederholt, bis alle Atome behandelt wurden.

Die Anwendung dieser Methode auf ein komplexeres Beispiel soll anhand von Phthalocyanin verdeutlicht werden ( Abbildung 7-11 ). Das -Elektronensystem in der RICOS-Repräsentation erstreckt sich über alle vier Isoindoleinheiten. Es besteht aus 40 Atomen und 42 Elektronen und enthält also zwei freie Elektronenpaare. Diese werden an den grau unterlegten Stickstoffatomen aufgrund des in Kapitel 7.2.2 vorgestellten Verfahrens lokalisiert. Die restlichen Elektronen werden in Einfach- und Doppelbindungen umgewandelt. Das Elektronensytemgerüst ist symmetrisch. Um jedoch eine nicht radikalische Anordnung von Einfach- und Doppelbindungen zu erhalten, dürfen nicht alle äquivalenten Bindungen die gleiche Zuordnung erhalten, drei der Sechsringe müssen je drei Doppelbindungen erhalten, im vierten sind zwei exocyclische Doppelbindungen erforderlich. Die Zuordnung der Bindungsordnungen erfolgt in vier Zyklen, in denen Startatome anhand der erweiterten Konnektivität ausgewählt werden. Jedes Startatom ist mit einem Punkt markiert und die Richtung der ersten Doppelbindung mit einem Pfeil angegeben. Die Reihenfolge, in der die Doppelbindungen zugeordnet wurden, ist durch die Zahlen angegeben. Quadrate markieren die Endpunkte jedes Zyklus, an der die Suche nach alternierenden Bindungen abgebrochen wird. Im ersten Zyklus ( Abbildung 7-11 a) werden die drei Doppelbindungen im unteren Sechsring zugeordnet, im zweiten Zyklus ( Abbildung 7-11 b), diejenigen des oberen Sechsrings. Im dritten Zyklus ( Abbildung 7-11 c) werden zunächst die Doppelbindungen 7 bis 10 ermittelt. Vor dem mit einem Dreieck markierten Verzweigungspunkt wird die Suche zunächst abgebrochen. Dann wird das Nachbaratom des Startatoms behandelt und die Doppelbindungen 11 und 12 festgelegt. Als nächstes wird anhand der Differenz zwischen Zahl der Nachbarn und dem Markierungswert festgestellt, daß das mit dem Dreieck markierte Atom nur noch einen unbehandelten Nachbarn besitzt und ausgehend von diesem die Doppelbindungen 13 bis 16 zugeordnet. Im letzten Zyklus ( Abbildung 7-11 d) werden die Doppelbindungen im rechten Sechsring zugeordnet.

Abb. 7-11: Konvertierung des -Elektronensystems in Phthalocyanin. Die Verteilung der Doppelbindungen erfolgt in vier Zyklen, die in a) bis d) dargestellt sind.

Um die Robustheit sowie den Zeitbedarf beider Konvertierungsverfahren zu testen, wurden 13 373 Verbindungen der Spektrendatenbank Specinfo [71] von einer VB-Struktur nach RICOS und wieder zurück konvertiert und beide VB-Repräsentationen miteinander verglichen. Die Datenbank enthält organische Neutralverbindungen und Salze. Alle Ionen eines Salzes wurden für die Konvertierung in isolierte Moleküle eines Ensemble zusammengefaßt, ohne jedoch die Wechselwirkungen zu spezifizieren. Die Konvertierung wurde mit einer Sun Sparc Workstation 512 durchgeführt und benötigte für die Richtung nach RICOS 0.01s pro Ensemble und von RICOS in eine VB-Struktur 0.11s pro Ensemble. In allen Fällen konnte eine gültige VB-Struktur erzeugt werden, die jedoch nicht immer exakt mit der eingegebenen Struktur übereinstimmt, wenn sie äquivalente Atome in -Elektronensystemen enthält oder mehrere mesomere Grenzformen der Verbindung möglich sind.



[Top] [Prev] [Next] [Bottom]
Diese Arbeit ist Teil der Dissertationen unter http://www2.chemie.uni-erlangen.de/services/dissonline/