Mit
der Einführung der kombinatorischen Chemie in Verbindung mit dem
High-Throughput-Screening (HTS) sollte die klassische
Wirkstofforschung revolutioniert werden. Von der Fähigkeit,
riesige Substanzbibliotheken parallel synthetisieren zu können
und breit angelegten Screeningtests zu unterziehen, wurden
Wissenschaftler in pharmazeutischen Firmen und an Hochschulen zu dem
Gedanken verleitet, einen Weg gefunden zu haben, den Zeit- und
Arbeitsaufwand für die Entwicklung eines neuen Wirkstoffs
drastisch zu reduzieren. Die Hoffnung, in den großen
Bibliotheken Verbindungen zu finden, die ohne weitere Optimierung als
potentielle Kandidaten für eine bestimmte Wirkung direkt in
klinischen Analysen untersucht werden könnten, wurde
mittlerweile aufgegeben. Die Schwierigkeiten, die sowohl auf der
Seite der kombinatorischen Synthese als auch auf der Seite des
High-Throughput-Screenings auftraten, haben die Grenzen dieses
Denkansatzes aufgezeigt.[1]
Inzwischen hat sich die Meinung durchgesetzt, daß strukturelle
Diversität, basierend auf einer möglichst großen
Anzahl an Verbindungen, nicht das einzige, ausschlaggebende Kriterium
für den Entwurf kombinatorischer Bibliotheken sein darf. Statt
dessen stehen heute kleinere Bibliotheken in der Größenordnung
von 10000 Verbindungen im Mittelpunkt des Interesses. Sie sollen eine
möglichst große strukturelle Vielfalt auf der einen Seite,
mit der biologischen Relevanz der Verbindungen auf der anderen Seite
kombinieren.
Je nach Stärke der Ausrichtung auf eine bestimmte biologische Aktivität kann die kombinatorische Chemie in zwei Stufen der Wirkstoffindung zum Einsatz kommen. So hat die Leitstrukturfindung das Ziel, aus einer großen Menge an Verbindungen diejenigen zu identifizieren, die eine signifikante Wirkung aufweisen. Dabei bilden neben den kombinatorischen Bibliotheken auch die Verbindungsdatenbanken, mit den in den einzelnen pharmazeutischen Firmen bekannten Strukturen, den Gegenstand der Suche. In der anschließenden Leitstrukturoptimierung wird der Versuch unternommen, die gefundenen Substanzen in ihrer biologischen Aktivität zu erhöhen. Dies geschieht häufig durch experimentell arbeitende Chemiker, die ihr Wissen und ihre oft langjährige Erfahrung zur Bearbeitung dieser Aufgabenstellung nutzen. Im Regelfall werden dazu Variationen der Molekülstruktur durch Veränderung von Art und Lage der Substituenten vorgenommen. Bleibt das Grundgerüst durch die strukturellen Manipulationen unberührt, kann eine solche Zielsetzung auch unter Zuhilfenahme der kombinatorischen Chemie verfolgt werden. Mit einem vorteilhaften Entwurf der zu diesem Zweck synthetisierten Bibliotheken soll der chemische bzw. physikochemische Raum um die aus der Leitstrukturfindung stammende Verbindung möglichst gut abgedeckt werden. Diesem Weg kommen die Fortschritte in der Entwicklung kombinatorischer Synthesetechniken der letzten Jahre zugute.[2] Erst die Vielzahl der zur Verfügung stehenden Reaktionen, sowohl der Festphasen- als auch der Lösungschemie, gewährleistet eine strukturelle Vielfalt der kombinatorischen Bibliotheken, die eine systematische Leitstrukturoptimierung erst ermöglicht.
Durch die globale Etablierung der kombinatorischen Chemie in Leitstrukturfindung und Leitstrukturoptimierung wurde ein Bedarf an neuen, computergestützten Methoden geschaffen. So müssen zum Design kombinatorischer Bibliotheken Techniken entwickelt werden, die gleichzeitig eine große strukturelle Diversität und eine Fokussierung auf eine bestimmte biologische Wirkung gewährleisten. Gleichzeitig bringt die Möglichkeit, mit Hilfe des High-Throughput-Screenings große Substanzmengen auf ihre biologische Aktivität zu untersuchen, eine Flut experimenteller Daten mit sich. Datenmengen dieses Umfangs können nur noch mit der Unterstützung von computerbasierten Methoden ausgewertet werden. Dabei sollen die eingesetzten Verfahren zur Analyse der Daten möglichst automatisiert ablaufen, so daß der Zeitbedarf für die Auswertung gesenkt werden kann und die Ergebnisse für weitere Aufgaben, wie das Design ergänzender Bibliotheken, schneller zur Verfügung stehen.
Derartige Problemstellungen werden in der Regel unter dem Oberbegriff der Chemoinformatik eingeordnet. Sie beschäftigt sich im allgemeinen mit der Verarbeitung von Informationen über kleine Moleküle. Neben Speichern, Visualisieren und Suchen von chemischen Strukturen sind deren physikalische, biologische und pharmazeutische Eigenschaften von Interesse. Dies schließt sowohl Software-Technologien zur Analyse großer Verbindungsdatenbanken oder bibliotheken als auch Methoden zur Modellierung einzelner chemischer Strukturen ein. Die Aktualität und Bedeutung der geschilderten Fragestellungen läßt sich auch an der Förderung des Verbundprojekts Suche und Optimierung von Leitstrukturen durch das Bundesministerium für Bildung und Forschung ablesen, in dessen Rahmen ein Großteil der vorliegenden Arbeit entstand.
Die Methoden, die hier vorgestellt werden, dienen zur Ableitung eines Zusammenhangs zwischen strukturellen und physikochemischen Eigenschaften von Verbindungen auf der einen Seite und der biologischen Aktivität auf der anderen Seite. Auf der Basis solcher Struktur-Wirkungsbeziehungen können Vorhersagen über das Verhalten von Verbindungen im High-Throughput-Screening gemacht werden. Über die Simulation des Screenings kann eine neu zu synthetisierende Bibliothek auf eine bestimmte biologische Aktivität ausgerichtet werden. Zur Ableitung von Struktur-Wirkungsbeziehungen werden künstliche neuronale Netzwerke eingesetzt, die aufgrund ihrer Konzeption auch große Datenmengen verarbeiten können. Hierbei haben sich die Kohonen-Netzwerke[3,4] durch ihre universelle Einsetzbarkeit als besonders leistungsstark erwiesen. Ihre primäre Aufgabe besteht in der Projektion eines hochdimensionalen Datenraumes in einen Raum niedrigerer Dimension. Meist ist der Zielraum zweidimensional. Dabei können die Ergebnisse des Lernvorgangs mittels Kohonen-Karten visualisiert und so leicht beurteilt werden. Es ist jedoch ebenso möglich, die potentiellen Aufgabenstellungen um die Bearbeitung von Klassifizierungs- und Regressionsproblemen zu erweitern. Somit können auf der Basis von selbstorganisierenden Netzwerken Modelle zur Vorhersage von Klassenzugehörigkeiten und metrischen Eigenschaften entworfen werden. Darin eingeschlossen ist die Aufstellung von quantitativen Struktur-Wirkungsbeziehungen. Im Gegensatz zu den klassischen Modellen von Hansch[5] oder Free und Wilson[6], die lineare Beziehungen zwischen der biologischen Aktivität und Strukturparametern formulieren, können in den Kohonen-Netzen auch nicht-lineare Beziehungen erkannt werden. Die selbstorganisierende Netzwerke haben sich als robustes Projektionsverfahren erwiesen. Für unterschiedliche Zufallsinitialisierungen des Netzes zu Beginn des Trainings konnte gezeigt werden, daß die Gefahr, in lokale Minima zu fallen, als gering angesehen werden kann, sofern die Trainingsparameter geeignet gewählt werden.[7]
Zur Optimierung der Qualität der auf der Basis von Kohonen-Netzwerken abgeleiteten Struktur-Wirkungsbeziehungen, wurde ein auf genetischen Algorithmen basierendes Verfahren entwickelt. Es hat zur Aufgabe, aus den Moleküldeskriptoren, die die Eigenschaften der Verbindungen kodieren, Elemente auszuwählen, die im Zusammenhang mit der biologischen Aktivität stehen. Durch die Beschränkung auf eine bestimmte Anzahl an Deskriptoren wird der Einfluß von Elementen, die keine für eine Struktur-Wirkungsbeziehung entscheidenden Informationen liefern, verringert. Wie die künstlichen neuronalen Netze das Gehirn zum Vorbild haben, so orientieren sich die genetischen Algorithmen an der Evolution.
Die vorliegende Arbeit gliedert sich in vier Abschnitte. Im ersten Abschnitt Künstliche neuronale Netze werden Methoden und Prinzipien der neuronalen Netzwerke vorgestellt. Der zweite Abschnitt Analyse von Verbindungsdatensätzen mit selbstorganisierenden neuronalen Netzen gibt eine Einführung in die Funktionsweise des Kohonen-Algorithmus und beschreibt gleichzeitig dessen Implementierung. Da die im Rahmen dieser Arbeit entwickelten Methoden darauf ausgerichtet sind, eine große Anzahl von Molekülen mit Hilfe eines einzelnen Netzwerkes zu untersuchen, werden weiterhin die verwendeten Moleküldeskriptoren zur Kodierung struktureller und physikochemischer Eigenschaften von Verbindungen vorgestellt. Zum Abschluß dieses Themenkomplexes wird eine Studie an einer kombinatorischen Bibliothek präsentiert, die Hydantoin als Grundgerüst aufweist. Für die Verbindungen dieser Bibliothek konnte erstmals eine quantitative Struktur-Wirkungsbeziehung mit Hilfe eines Kohonen-Netzwerkes abgeleitet werden. Durch ein Klassifizierungsmodell können die Ergebnisse des High-Throughput-Screenings vorhergesagt werden. Trotz dieses Erfolges wurden Schwächen der herkömmlichen Strukturkodierung durch die Moleküldeskriptoren deutlich. Da alle verwendeten Deskriptoren die gesamte Molekülstruktur beschreiben, konnte das Klassifizierungssystem nicht auf Verbindungen übertragen werden, denen kein Hydantoin-Gerüst zugrunde lag. Der dritte Abschnitt der Arbeit Ermittlung relevanter Deskriptoren beschäftigt sich daher mit der Auswahl von Deskriptoren bzw. Deskriptorelementen, die für eine gegebene Problemstellung von Bedeutung sind. Basierend auf genetischen Algorithmen wurde eine Methode entwickelt und implementiert, mit deren Hilfe wichtige Elemente in einem vektoriellen Moleküldeskriptor erkannt werden können. Neben einer Einführung in die Optimierung mittels genetischer Algorithmen wird beschrieben, wie die Chromosomen und genetischen Operatoren für diese Aufgabe ausgelegt wurden. Da in diesem Fall Kohonen-Netzwerke der Gegenstand der Optimierung sind, mußten geeignete Maße zur Beurteilung der Güte des Netzes für Projektions-, Klassifizierungs- und Regressionsprobleme definiert werden. In einer Studie an Verbindungen mit bekannter Affinität zum Rezeptor des Plättchen-aktivierenden Faktors wurden die Ergebnisse der Kohonen-Netzwerke verglichen, die mit den gesamten Deskriptoren und mit einer Auswahl an Deskriptorelementen erzielt wurden. Es zeigte sich, daß die Reduzierung der Dimension der Deskriptoren in der Regel zu besseren Ergebnissen führte. Um einen Einblick in den Status der entwickelten Programme gewähren zu können, werden diese im letzten Teil der Arbeit Programmbeschreibung kurz vorgestellt.
[1]Bormann, S. Reducing Time to Drug Discovery. CENEAR 1999, 77(10), 33-48.
[2]Griebenow, N.; Hansel, J.-G.; Jordan, S.; Wunberg, T. Kombinatorische Chemie, Nachr. Chem. Tech. Lab. 1999, 47, 283-285.
[3]Kohonen, T. Self-organized Formation of Topologically Correct Feature Maps. Biol. Cybern. 1982, 43, 59-69.
[4]Kohonen, T. Self-Organization and Associative Memory, Springer-Verlag: Berlin, 1989.
[5]Hansch, C.; Fujita, T. r-, s-, p-Analysis: A Method for the Correlation of Biological Activity and Chemical Structure. J. Am. Chem. Soc. 1964, 86, 1616-1626.
[6]Free, S. M.; Wilson, J. W. A Mathematical Contribution to Structure Activity Studies. J. Med. Chem. 1964, 7, 395-399.
[7]Kohonen, T. Self-Organizing Maps. Springer Series in Information Sciences; Huang, T. S.; Kohonen, T.; Schroeder, M. R., Eds.; Springer-Verlag: Berlin, 1995, 106-107.