3.4 Andere Anwendungen

An dieser Stelle sollen einige Anwendungen der Transformationssuchen erläutert werden, die nicht unmittelbar zur Syntheseplanung dienen, aber dennoch wertvolle Informationen liefern.

Da für einen Katalog Tabellen von Hashcodes gemäß den Transformationsregeln ermittelt werden, kann man diese Tabellen benutzen, um folgende Fragestellungen zu beantworten:

o

o Um die erste Frage zu konkretisieren: Man ist an der Zahl der Verbindungen interessiert, die exklusiv nur in einem Katalog vorkommen und an der Zahl der Verbindungen, die in beiden Katalogen vorhanden sind. Aus diesen Zahlen läßt sich abschätzen, inwieweit ein weiterer Katalog zusätzliche chemische Information in sich birgt. Denn ein weiterer Katalog, der kaum neue Verbindungen bietet, stellt kaum einen zusätzlichen Wert dar. Auch die Frage, ob eine bestimmte Verbindung schon in einem Katalog vorhanden ist, läßt sich leicht beantworten. Tabelle 3 - 10 berichtet über eine Analyse der WODCA-Kataloge.

Tab. 3 - 10 Katalog-Analyse: Zahl gemeinsamer Einträge (Überlappungen) und Zahl der nur in einem Katalog vorhandenen Verbindungen.

Katalog

verschiedene1 Einträge

gemeinsam mit Katalog

Einträge in Katalog

... und nicht in Katalog

Janssen

Fluka

Trivial
namen

Janssen

Fluka

Trivialnamen

Janssen

7.847

4.147

1.449

Janssen

3.700

6.398

Fluka

10.941

1.677

Fluka

6.794

9.264

Trivialnamen

17.084

Trivialnamen

15.635

15.407

1
Verschiedene Einträge ist die Zahl der nicht identischen Verbindungen. Manche Verbindungen erscheinen mehrfach in Katalogen, etwa weil sie in verschiedenen Reinheitsgraden angeboten werden. Stereochemische Unterschiede werden nicht berücksichtigt.

Die Überschneidung des Janssen- mit dem Fluka-Katalog ist zwar deutlich (über 4.000 gemeinsame Verbindungen, das sind mehr als 50 % bezogen auf den Janssen-Katalog), andererseits auch nicht überraschend, da ja beide Kataloge von Feinchemikalien-Anbietern stammen. Daß dagegen der Trivialnamen-Katalog nur 1.449 bzw. 1.677 Verbindungen mit den Katalogen Janssen bzw. Fluka gemeinsam hat, konnte erwartet werden. Eine entsprechende Analyse ermittelt eine Gesamtzahl von 29.742 verschiedenen Verbindungen aus der Gesamtzahl von 45.674 Einträgen der drei Kataloge Janssen, Fluka und Trivialnamen.

Gefragt nach der chemischen Vielfalt eines Kataloges, wird hier wieder im Hinblick auf die Syntheseplanung. Vielfalt bedeutet dann: Wie viele verschiedene C-Skelette? Wieviel verschiedene Ringsysteme? Wie viele verschiedene Substitutionsmuster? etc. Diese Fragen können anhand der durch die entsprechenden Transformationsregeln resultierenden Hashcode-Tabellen leicht beantwortet werden. Die Zahlen enthält Tabelle 3 - 11. Man beachte beispielsweise, daß die Zahl der verschiedenen C-Skelette in den Katalogen Janssen und Fluka nur ein Bruchteil der tatsächlichen Anzahl an Verbindungen ausmacht (11,5 bzw. 9,3 % der Zahl verschiedener Einträge). Noch niedriger liegen diese Werte, wenn man auch CC-Mehrfachbindungen ignoriert (Transformation Reduziertes C-Skelett"). Nur 516 bzw. 603 verschiedene C-Skelette enthalten dann die Kataloge Janssen und Fluka. Betrachtet man die reinen Ringsysteme gibt es davon 461 bzw. 629 verschiedene bei Janssen bzw. Fluka. Deutlich höher liegt diese Zahl natürlich für den Trivialnamen-Katalog (3.302). Hier sind ja auch statt Bausteinen für Synthesen Naturstoffe zu finden.

Tab. 3 - 11 Variationen einzelner struktureller Merkmale in verschiedenen WODCA-Katalogen. Die Zahlen geben die Anzahl der nach der entsprechenden Transformation verschiedenen Verbindungen je Katalog an.

Kriterium
(Transformation)

Janssen

Fluka

Trivial-namen

Gesamtzahl verschiedener Einträge (Identität)

7.847

10.941

17.084

Gesamtzahl verschiedener Einträge unter Berücksichtigung von Stereochemie und Isotopen (Stereochemische Identität)

7.940

11.533

C-Skelett

905

1.020

4.949

Reduziertes C-Skelett

516

603

2.650

Ringe und C-Skelett

1.591

1.926

7.913

Ringsystem

461

629

3.302

Substitutionspositionen auf dem Ringsystem

1.145

1.326

6.474

Substitutionspositionen auf dem reduzierten Ringsystem

855

1.049

5.107

Substitutionsmuster
(-AR+A1-CCMB-BO-MU)

2.113

2.098

8.098

Substitutionsmuster
(-AR+A1+CCMB-BO-MU)

2.234

2.255

8.876

Substitutionsmuster
(-AR+A1-CCMB+BO+MU)

2.656

2.617

9.614

Substitutionsmuster
(-AR+A1+CCMB+BO+MU)

2.864

2.878

10.500

Eliminierung und Substitutionsmuster

2.295

2.335

9.386

Ozonolyse und Substitutionsmuster

2.030

2.049

8.183