3.3 Anwendungen in der Syntheseplanung

Dieser Abschnitt beschreibt Einzelheiten der für die Syntheseplanung implementierten Transformationssuchen. Nach einigen allgemeinen Bemerkungen, die für alle Transformationsregeln gelten, werden letztere im Detail vorgestellt.

3.3.1 Kataloge

Um geeignete Ausgangsmaterialien für ein Syntheseziel auswählen zu können, sind Sammlungen solcher Verbindungen in computer-lesbarer Form (Datenbanken) notwendig. Darauf wurde bereits im Abschnitt 2.2.1 eingegangen. An dieser Stelle sollen diejenigen Kataloge mit Ausgangsmaterialien benannt werden, die innerhalb dieser Arbeit Verwendung fanden (siehe Tab. 3 - 6).

Übernommen wurde der Katalog der Firma Janssen Chimica, Belgien (Stand 1987) aus dem alten WODCA System. Allerdings mußten die Hashcode-Tabellen für die neuen, tcl-basierten Transformationssuchen neu berechnet werden. Obwohl dieser Katalog nicht mehr dem aktuellen Stand entspricht1, dient er weiterhin als wertvolles Reservoir für Synthesebausteine, da davon ausgegangen werden kann, daß die verzeichneten Verbindungen bei dem einen oder anderen Feinchemikalienanbieter erhältlich sein werden.

Neu ist der Katalog der Fluka Chemie AG, der seit Mitte 1995 korrespondierend zur gedruckten Ausgabe 1995/96 als flukalog© 1.0 in Form einer Strukturdatenbank für MDL`s ISIS System erworben werden kann. Dieser Katalog wurde in das für WODCA erforderliche Dateiformat konvertiert.

Ein für Anwendungen in der Syntheseplanung weniger geeigneter, nichtsdestoweniger aber sehr interessanter Katalog ist der VCH Trivialnamenkatalog (Band 1 und 2), der uns in elektronischer Form vom FIZ Chemie Berlin zur Verfügung gestellt wurde. Enthalten sind mehr als 20.000 Verbindungen. Das sind hauptsächlich Naturstoffe ohne weitere Informationen zu kommerzieller Verfügbarkeit. Daher ist dieser Katalog weniger zur ausgangsmaterial-orientierten Syntheseplanung geeignet. Auch dieser Katalog mußte konvertiert werden.

Tab. 3 - 6 Wichtige Kataloge des WODCA Systems

Anbieter

Originalgröße

Größe als WODCA Katalog

davon leere1
Einträge

Bemerkungen

Janssen Chimica

8.4642

8.464

0

Stand 1987

Fluka Chemie

16.781

16.769

2.512

Entspricht flukalog 1.0 (1995).

FIZ Chemie Berlin (VCH)

21.812

20.441

0

Stand Band 1 und 2 der 1. Auflage des gedruckten Werkes (1993)

1
Leer bedeutet, daß ein solcher Katalogeintrag keine Strukturformel enthält. Andere Informationen wie Namen, Reinheit, Packungsgrößen etc. können aber vorhanden sein.
2
Von der vorangehenden WODCA Version übernommen.

Bei der Konvertierung der Kataloge in das CTX2-Format [91] gehen einige Einträge verloren. Das sind Verbindungen, die aufgrund des Größenlimits (mehr als 300 Atome, 600 Bindungen oder 75 Ringe) oder nicht codierbarer chemischer Merkmale (z. B. 3-Zentren-Bindungen wie in Boranen oder Metallionen mit mehr als acht Liganden wie in Metallocenen) vom WODCA System nicht behandelt werden können. Fehlcodierungen in den Originaldaten wurden soweit wie möglich korrigiert. Prinzipiell können beliebige Sammlungen chemischer Verbindungen als WODCA Katalog aufbereitet werden. Für einige verbreitete Dateiformate (Molfile, SDFile von MDL [92]; SMD3 [93], [94]; PDB4 [95]) stehen Konvertierungsprogramme bereit [89]. Meist kann für jedes definierte Dateiformat mit begrenztem Aufwand ein Konvertierungstool programmiert werden.

Tab. 3 - 7 Durchschnittliche Zahlen für alle nicht leeren Einträge der verschiedenen Kataloge des WODCA Systems.

Katalog

Zahl der

Atome

Schweratome

C-Atome

Ringe

Janssen

22

12

8

1

Fluka

28

14

9

1

Trivialnamen

43

21

16

2

Aus der konvertierten CTX-Datei wird eine index-sequentiell lesbare Master-Datei (ebenfalls in CTX) angelegt. Parallel dazu werden eine ganze Reihe weiterer Dateien erzeugt, die einen schnellen (und portablen) Zugriff auf die Einträge gestatten. Von großer Bedeutung sind die für die Transformationssuchen notwendigen Hashcode-Dateien. Je Ähnlichkeitskriterium wird eine binäre Datei erzeugt, die das betreffende Transformationsresultat je Katalogverbindung als 32-Bit-Integer-Zahl codiert. Der Zeitaufwand für die verschiedenen Schritte der Katalogerstellung ist recht unterschiedlich. Während die Dateiformat-Konvertierung in der Größenordnung von etwas mehr als einer Zehntel CPU-Sekunde5 je Verbindung liegt, beträgt der Aufwand für die Erstellung der Master-Datei etwa 2-3 CPU-Millisekunden6 je Verbindung. Deutlich rechenintensiver ist dagegen die Generierung der Transformations-Hashcodes. Diese Aufgabe wird tcl-basiert durchgeführt, d. h. von einem Interpreter-Programm. Abbildung 3 - 2 stellt den Zeitaufwand (CPU-Zeit7) je Katalogeintrag für einige Transformationen grafisch dar. Vollständiges Zahlenmaterial findet sich im Anhang A in Tabelle A - 1. Soweit vorhanden, sind Vergleichswerte für die analoge Berechnung mittels eines compilierten Fortran-Programms angegeben. Die tcl-basierte Berechnung dauert um einen Faktor von 14 (Hydrolyse ohne Aromatensubstituenten und Oxidation) bis 5 (Ozonolyse) länger. Der Leistungsunterschied ist deutlich, jedoch durchaus akzeptabel. Dazu muß man bedenken, daß diese Berechnung nur einmalig bei Vorbereitung des Kataloges oder bei Neudefinition einer Transformationsregel durchgeführt werden muß. Bei Anwendung der Transformation werden Zeiten in der Größenordnung der Spalte Zeit pro Eintrag" beansprucht, d. h. maximal einige Sekunden - unabhängig von der Größe des durchsuchten Katalogs.8 Dem Gewinn der flexiblen Definition von Ähnlichkeitssuchen steht also ein annehmbarer höherer Zeitaufwand bei der Vorbereitung eines Kataloges gegenüber. Man beachte auch, daß die Größe der in einem Katalog enthaltenen Verbindungen und deren Topologie (Ringe) nicht unerheblich die Transformationen beeinflussen (vgl. dazu Tabelle 3 - 7). Die durchschnittlich größten Einträge mit den meisten Atomen und Ringen finden sich im Trivialnamen-Katalog. Für diesen Katalog werden auch etwa doppelt so lange Zeiten je Eintrag beobachtet wie für den Janssen-Katalog, Extremfälle brauchen gar dreimal soviel Zeit. Bei den eher vergleichbaren Katalogen Janssen und Fluka findet man noch um ca. 11/2 mal längere Zeiten für den etwas größere Verbindungen enthaltenden Fluka-Katalog. Diese Werte können als Anhaltspunkte dienen, um abzuschätzen, mit welchen Aufwand für einen beliebigen Katalog gerechnet werden muß. Für einen Katalog mit einem Inhalt ähnlich dem des Fluka-Kataloges, 10.000 Verbindungen, 38 Transformationen und einem durchschnittlichen Aufwand von 1,4 CPU-Sekunden je Eintrag resultieren 532.000 Sekunden, das ist eine Rechenzeit von sechs Tagen, drei Stunden, 46 Minuten und 40 Sekunden - ein durchaus vertretbarer Aufwand.

Abb. 3 - 2

Zeitaufwand je Katalogeintrag (Verbindung) für verschiedene Transformationssuchen. Alle dargestellten Werte wurden für eine Sun-Workstation (Sparc 10/512) und eine SunOS-Programmversion ermittelt.


3.3.2 Grundlegendes

Die Transformationssuchen sollen primär dazu dienen, für gegebene Verbindungen ähnliche Ausgangsmaterialien auszuwählen. Es sind also Verbindungen gefragt, die sich zur Synthese der Anfrageverbindungen einsetzen lassen Die zu diesem Zweck notwendige Definition von Ähnlichkeit basiert vor allen auf zwei Grundlagen: dem (Kohlenstoff-)Skelett und der auf dem Skelett verteilten Funktionalität.

Das Skelett einer Verbindung kann als die erste Basis von für Synthesen relevanter Ähnlichkeit dienen. Oft kann es das reine Kohlenstoffskelett sein. CC-Mehrfachbindungen können dabei meist ignoriert werden.

Wipke [35] schätzte, daß nur etwa 20 % aller CC-Bindungen eines Syntheseziels nicht schon im Ausgangsmaterial vorhanden waren. Dagegen wurden ca. 40 % aller C-Heteroatom-Bindungen (im folgenden CX-Bindungen) im Syntheseziel erst im Laufe der Synthese geknüpft. Will man beispielsweise ein bestimmtes C5-Skelett synthetisieren, ist es naheliegend, dieses Skelett bereits aus einem Ausgangsmaterial zu übernehmen. Dieses sehr einfache Kriterium kann die aus einem Katalog von Ausgangsmaterialien in Frage kommenden Verbindungen bereits drastisch einschränken. Abbildung 3 - 3 unterstreicht das. Die Zahl an Verbindungen, die einem bestimmten (acyclischen) Skelett entsprechen, liegt im Extremfall (C2-Einheit) in der Größenordnung von 1.000. Größere Skelette sind sehr viel rarer.

Dieser Art der skeletalen Ähnlichkeit bedienen sich die WODCA-Transformationssuchen C-Skelett" oder Reduziertes C-Skelett".

Einen Spezialfall stellen Ringsysteme dar. Handelt es sich um reine Kohlenwasserstoffe gilt auch hier, daß CC-Bindungen viel seltener als CX-Bindungen im Verlauf der Synthese aufgebaut werden. Aromatische Systeme stellen eine weitere Besonderheit dar. Für diese läßt sich eine noch höhere Tendenz zur Übernahme aus einem Ausgangsmaterial feststellen [35], d. h. aromatische Bindungen werden noch seltener im Verlauf der Synthese verändert. Gehören zu einem Ringsystem jedoch Heteroatome (cyclische Ether, Amine, Lactone, Lactame etc., Pyridine, Furane, Thiophen usw.), stellen diese Heteroatome einen zentralen Bestandteil des Skeletts dar, sind also als Ähnlichkeitskriterium einzubeziehen. Vor diesem Hintergrund wurden die WODCA-Transformationssuchen Größtes Ringsystem", Ringe und C-Skelett" und C-Skelett und Aromaten einschließlich -Atome" entwickelt.

Offensichtlich ist, daß mittels dieser Kriterien auch die allgemeinste Art an skeletaler Ähnlichkeit definiert wird. Das bedeutet, wenn diese Kriterien für eine gegebene Anfrageverbindung keinerlei Treffer liefern, daß spätestens dann die Methoden zur Suche nach strategischen Bindungen angewandt werden müssen. Werden aber zu viele Verbindungen gefunden (in der Praxis einige Hundert oder mehr Treffer), müssen selektivere Ähnlichkeitskriterien angewendet werden.

Selektivere Ähnlichkeit läßt sich problemlos auf der Basis der Funktionalität einer Verbindung definieren. Ein bestimmtes Skelett allein ist ein guter Filter zur Auswahl von Verbindungen aus einem Katalog. Findet auch die Funktionalität Beachtung, so reduzieren sich die in Frage kommenden Verbindungen noch drastischer (siehe Abb. 3 - 4).

Abb. 3 - 3

Zahl an Katalogverbindungen, die bestimmten C-Skeletten entsprechen (Suche mit Transformation Reduziertes C-Skelett"). Angegeben sind die Trefferzahlen für C-Skelette von C1 bis C8. Man beachte, daß hier wirklich Skelette gesucht wurden und nicht Elementzählungen.


Mit den verschiedenen Möglichkeiten, wie Substituenten behandelt werden können, d. h. wie sie die Ähnlichkeit von Verbindungen beeinflussen können, befaßt sich Abschnitt 3.3.4 eingehend.

Abb. 3 - 4

Beispiele für die Anwendung einfacher Ähnlichkeitskriterien zur Auswahl von Ausgangsmaterialien. Ganz links die Gesamtzahl an Verbindungen zweier durchsuchter Kataloge. Daneben die Zahl der Verbindungen, die ein n-Pentan-Skelett enthalten. Rechts eine Ähnlichkeitssuche nach beliebig in 1-Position substituierten n-Pentanen.


Für alle Transformationen des WODCA Systems gelten einige grundlegende Konventionen, die immer zur Anwendung kommen.

Viele Transformationsregeln fragmentieren eine Originalverbindung. Resultat sind also mehr oder weniger große transformierte Verbindungen. In solchen Fällen wird nur das größte Fragment zur Hashcodeberechnung herangezogen, die anderen Fragmente werden verworfen. Dem liegt die Erfahrung zugrunde, daß Ähnlichkeit zwischen den wichtigsten Teilen zweier Verbindungen erkannt werden soll und sich diese Wichtigkeit am ehesten über die Größe dieser Teile messen läßt.

Im alten WODCA System lag der Größenberechnung Gleichung (3-1) zugrunde.

(3-1) Größe(Mol) = 1.000.000 · natom(Mol) - 10 · M(Mol) + Mol

mit
Mol Molekülindex
natom Zahl der Atome je Molekül
M molare Masse des Moleküls

Man beachte, daß die Molmasse abwertend wirkt. Das bedeutet, daß leichtere Fragmente als größer betrachtet werden als schwerere Fragmente. Das wurde eingeführt, um Phenylringe abzuwerten, und von der Zahl der Atome gleichgroße, aber leichtere Fragmente höherzubewerten. Das führt aber zu unerwünschten Nebeneffekten. Mit obigem Ansatz wird aus den in Abbildung 3 - 5 dargestellten Molekülen n-Propanol als das größte ausgewählt.

Abb. 3 - 5

Auswahl des größten" Moleküls nach Gleichung (3-1). Oben: Methan ist größer als die Chlorderivate. Unten: Propanol wird als größer betrachtet als Benzol, aber auch als Hexadiin(1,5). Dabei hängt die Plazierung Benzol/Hexadiin von der Reihenfolge der Moleküleingabe ab.


Im WODCA System Version 3 wird dieses Verfahren daher durch den folgenden Ansatz ersetzt:

(3-2) Größe(Mol) = 100.000 · natom(Mol) + 10 · M(Mol)

Hier wird bei gleicher Anzahl an Atomen das schwerere Molekül als größer betrachtet. Sollte auch dann noch keine Entscheidung möglich sein, werden die Hashcodes zur Entscheidung herangezogen: Das Molekül mit dem größten Hashcode wird ausgewählt. Für die Beispiele in Abbildung 3 - 5 heißt das: Chloroform bzw. Hexadiin sind die größten Moleküle.

Abb. 3 - 6

Auswahl des größten Moleküls im WODCA System Version 3. Diese Entscheidung entspricht mehr der Intuition des Chemikers. Man beachte, daß die Entscheidung Benzol/Hexadiin erst durch die Hashcodes der beiden Moleküle bestimmt wird.


Nach wie vor werden Phenylringe damit tendenziell abgewertet. Allerdings werden Phenylringe jetzt erst durch aliphatische C4-Einheiten als größte Moleküle verdrängt, mit Gleichung (3-1) waren dazu bereits C3-Einheiten ausreichend.

Weiterhin werden Verbindungen, wenn sie einer Transformationsregel unterworfen werden, normalisiert. Das bedeutet, daß Tautomere in ein definiertes Isomer überführt werden, Ladungsstellen beseitigt werden. Dieses Vorgehen soll absichern, daß verschieden codierte, aber offensichtlich identische Verbindungen, auch als identisch erkannt werden (siehe Abb. 3 - 7).

Abb. 3 - 7

Beispiele für die Nützlichkeit der Normalisierung: Oben: Die als Imid formulierte Anfrage findet die als Aminocrotonsäurenitril codierte tautomere Katalogverbindung. Unten: Die mit Ladungen codierte Aminosäure findet ihr ladungsfreies Pendant im Katalog.


Die für das WODCA System Version 3 erarbeiteten Transformationsregeln, die nunmehr als tcl-Skripts codiert sind, orientieren sich an den Erfahrungen, die mit Transformationen des alten WODCA Systems gemacht wurden. Einige Transformationsregeln wurden ersatzlos gestrichen, weil deren Nützlichkeit zweifelhaft oder aber ihr Unterschied zu anderen Regeln marginal ist. Dafür wurden einige bisher nicht verfügbare Transformationsregeln codiert, die sich im routinemäßigen Gebrauch als sehr effektiv erweisen. Die Algorithmen der übernommenen Transformationsregeln wurden gründlich überarbeitet. Sie unterscheiden sich im Einzelfall deutlich von ihren Fortran77-Vorgängern. Das folgt schon allein aus der Tatsache, daß sich die Möglichkeiten der codierenden Sprachen (Fortran77 bzw. tcl) wesentlich unterscheiden. Die folgende Tabelle stellt alle im alten WODCA System vorhandenen sowie die nun in der Version 3 verfügbaren Transformationsregeln zusammen.

Tab. 3 - 8 Gegenüberstellung der Fortran77- und tcl-basierten Transformationsregeln

Name

F77

tcl

Klasse1

Identität

8

8

S

Identität unter Beachtung von Stereochemie und Isotopenmustern

8

8

S

Größtes Molekül

8

8

S

Elementaustausch innerhalb einer Spalte des Periodensystems

8

-----

S

Elementaustausch (wie vorher) und Austausch von ZHn-Gruppen

8

8

S/R

C-Skelett und Elementaustausch

8

-----

S/R

Größtes Ringsystem

8

8

S

Substitutionspositionen auf dem reduzierten Ringsystem

8

8

S

Substitutionspositionen auf dem Ringsystem

-----

8

S

Ringe und C-Skelett

8

8

S

C-Skelett

8

8

S

Reduziertes C-Skelett

8

8

S

Aromatensystem einschließlich -Atome

8

8

S

C-Skelett einschließlich -Atome

8

8

S

C-Skelett einschließlich -Atome einschließlich Stereochemie

8

-----

S

C-Skelett und Aromaten einschließlich -Atome

8

8

S

C-Skelett und Aromaten einschließlich -Atome einschließlich Stereochemie

8

-----

S

Entfernung terminaler Alkylgruppen

8

-----

S

Entfernung von homologierenden CH2-Gruppen

8

-----

S

Entfernung symmetrischer Substituenten

8

-----

S

Substitutionsmuster (-AR+A1-CCMB-BO-MU)2

-----

8

S/R

Substitutionsmuster (-AR+A1+CCMB-BO-MU)b

-----

8

S/R

Substitutionsmuster (-AR+A1-CCMB-BO+MU)b

-----

8

S/R

Substitutionsmuster (-AR+A1+CCMB-BO+MU)b

8

8

S/R

Substitutionsmuster (-AR+A1-CCMB+BO+MU)b

8

8

S/R

Substitutionsmuster (-AR+A1+CCMB+BO+MU)b

8

8

S/R

Substitutionsmuster (-AR-A1-CCMB-BO-MU)b

8

8

S/R

Substitutionsmuster (-AR-A1+CCMB-BO-MU)b

8

8

S/R

Substitutionsmuster (-AR-A1-CCMB-BO+MU)b

8

8

S/R

Substitutionsmuster (-AR-A1+CCMB-BO+MU)b

8

8

S/R

Substitutionsmuster (-AR-A1-CCMB+BO+MU)b

8

8

S/R

Substitutionsmuster (-AR-A1+CCMB+BO+MU)b

8

8

S/R

Maximale Oxidation

8

8

R

C-Skelett inklusive -Atome und maximale Oxidation

8

8

R

Maximale Reduktion

8

8

R

C-Skelett inklusive -Atome und maximale Reduktion

8

8

R

Maximale Reduktion (ohne Aromaten)

8

8

R

Maximale Reduktion (ohne C-Aromaten)

8

8

R

Hydrolyse ohne Aromatensubstituenten

8

8

R

Hydrolyse einschließlich Aromatensubstituenten

8

8

R

Hydrolyse ohne Aromatensubstituenten und Oxidation

8

8

R

Hydrolyse einschließlich Aromatensubstituenten und Oxidation

8

8

R

Eliminierung

8

8

R

Eliminierung und Substitutionsmuster (-AR-A1+CCMB-BO-MU)b

8

-----

R

Eliminierung und Substitutionsmuster (-AR+A1+CCMB-BO-MU)b

-----

8

R

C-Skelett einschließlich Aromaten mit -Atomen, dann Eliminierung

8

8

R

C-Skelett einschließlich Aromaten mit -Atomen, dann Reduktion, dann Eliminierung

8

-----

R

Eliminierung, dann Reduktion

8

-----

R

Eliminierung, dann Reduktion ohne Aromaten

8

-----

R

Eliminierung, dann Reduktion ohne C-Aromaten

8

-----

R

Eliminierung, dann Reduktion ohne Aromaten, dann Substitutionsmuster (-AR-A1-CCMB-BO-MU)

8

-----

R

Ozonolyse

8

8

R

Ozonolyse und Substitutionsmuster (-AR-A1-CCMB-BO-MU)b

8

-----

R

Ozonolyse und Substitutionsmuster (-AR+A1-CCMB-BO-MU)b

-----

8

R

Ozonolyse, dann Hydrolyse, dann Oxidation

8

-----

R

Ozonolyse, dann C-Skelett, dann Reduktion

8

-----

R

1
S: substruktur-orientiert; R: reaktionsklassen-orientiert
2
Zur Bedeutung der Kürzel siehe Abschnitt 3.3.4.

Zwei Klassen von Transformationen können unterschieden werden:

o

o Unter substruktur-orientierten Transformationen kann man all jene Ähnlichkeitskriterien verstehen, die mittels klassischer Substruktursuchen ebenfalls erzielt werden können. Jedoch befreit eine substruktur-orientierte Transformation den Anwender von der Spezifikation einer Substruktur. Eine Originalstruktur (d. h. eine chemisch korrekt codierte Verbindung ohne freie Valenzen oder Listen von Atomarten an bestimmten Positionen) wird direkt für die Suche verwendet. Die Transformationsregel definiert die Substruktur. Außerdem ist die Transformationssuche in der Regel9 schneller als eine Substruktursuche: Im ersten Fall werden nach der automatischen Manipulation der Anfrageverbindung nur Hashcodes verglichen. Im letzten Fall muß ein intelligentes Screening die tatsächlich Atom für Atom auf die Anfrage abzubildenden Katalogverbindungen drastisch reduzieren. Dieses Mapping ist bereits für einige Dutzend Paare aufwendiger als der Vergleich von Tausenden von Hashcodes.

Die an Reaktionsklassen orientierten Transformationen erweisen sich in der Praxis als noch leistungsfähiger für die computer-gestützte Syntheseplanung.10 Es werden mit diesen Transformationen Ergebnisse erzielt, die mit herkömmlichen Substruktursuchen in dieser Selektivität und Vollständigkeit nicht oder aber nur mittels mehrerer Substruktursuchen erreichbar sind. Desweiteren werden gerade für die Syntheseplanung interessante Relationen zu Ausgangsverbindungen gefunden, die dann auch für eine Synthese einsetzbar sind.

Es sei an dieser Stelle daran erinnert, daß durch die neue Implementation mittels einer Skriptsprache, jederzeit auf einfache Art und Weise weitere Transformationsregeln codiert oder aber vorhandene ausgetauscht werden können. Auch sind diese Transformationsregeln mit der Ähnlichkeit die sie definieren, an der Syntheseplanung orientiert. Andere Sätze von Transformationsregeln, für Ähnlichkeitssuchen in anderen Anwendungsbereichen (z. B. Pharmakologie) sind leicht vorstellbar.





1
Janssen Chimica firmiert inzwischen unter dem Namen Acros Chimica, der neueste Katalog hat ca. 2.000 Einträge mehr.
2
Clear Text File
3
Standard Molecular Data
4
Brookhaven Protein Data Bank
5
Konvertierung des Fluka-Kataloges aus dem SDFile-Format nach CTX mittels eines tcl-Skripts. Die eigentliche Arbeit machen dabei allerdings C-Routinen. Zeit gültig für Sun Sparc 10/512 bzw. 10/40 oder SGI Indigo2 R4000.
6
Gültig für Sun Sparc 10/512 bzw. 10/40. Sun Sparc 10/20 liegen bei etwa 5 ms.
7
Gemeint ist damit die Summe aus der eigentlichen Prozeßzeit und der Zeit, die dieser Prozeß für Systemaufrufe benötigte.
8
Das mag zunächst verblüffend klingen. Die eigentliche Suchzeit, d. h. der Vergleich des Hashcodes der transformierten Anfrageverbindung mit den im Voraus berechneten Hashcodes der Katalogverbindungen, liegt im Bereich von bestenfalls Millisekunden.
9
Bestenfalls liegen Substruktursuche und Transformationssuche gleichauf. Das ist besonders dann zu erwarten, wenn das Screening vor der eigentlichen Substruktursuche die in Frage kommende Zahl möglicher Treffer stark reduziert.
10
Im Einzelfall kann die Einordnung einer Transformation in die eine oder andere Gruppe strittig sein.