Neben der praktischen Labortätigkeit zeichnet sich die chemische Forschung
in der Regel durch die schnelle, zuverlässige und vollständige Abfrage und
Analyse von bereits bestehenden Literaturangaben, Lehrbuchwissen sowie Struktur-
und Aktivitätsdaten aus. Während in den Anfängen der klassischen Chemie lediglich
auf papierbasierte, zweidimensionale Strukturdaten und textuelle Information
zugegriffen wurde, reichen solche Darstellungsformen und Medien heute insbesondere
in der Pharmaforschung und Biochemie nicht mehr zum Verständnis und zur Analyse
komplexer Sachverhalte aus. Zur Lösung dieser Problematik nutzen Chemiker
daher seit langem die Möglichkeiten der computergestützten Visualisierung,
wobei heute eine fast unüberschaubare Auswahl an kommerziellen und frei verfügbaren
Anwendungen zur Darstellung und visuellen Analyse von molekularen Eigenschaften,
Oberflächen und Dynamiken zur Verfügung steht. Diese Applikationen dienen
jedoch in der Regel zur Lösung einzelner, spezifischer Frage- und Problemstellungen
und sind im Allgemeinen zueinander nicht kompatibel, was den essentiellen
Informationsfluss und -austausch von chemischen Daten stark beeinträchtigt
oder sogar verhindert. Insbesondere seit der durch automatisierte Laborsysteme
generierten Informationsflut hat diese Situation an Brisanz gewonnen. Um einen
einfachen, standardisierten und Datenzugriff zu gewährleisten, kommen in der
chemischen Industrie heute zunehmend portable Informationsmanagement- und
Visualisierungs-Systeme zum Einsatz. Da die bis dato
erhältlichen portablen Standardapplikationen zur Visualisierung chemischer
Daten lediglich einfache, rudimentäre Strukturdarstellungen sowie in Ausnahmefällen
auch eine begrenzte Visualisierung komplexer Datenobjekte wie Oberflächen
erlauben, ist die Entwicklung plattformunabhängiger Visualisierungsanwendungen
heute dringend erforderlich.
Das Potential interaktiver und portabler Visualisierungssoftware wurde dabei
nicht nur in der chemischen Industrie erkannt, sondern wird in zunehmenden
Maße von akademischen Einrichtungen zur didaktischen Vermittlung von chemischen
Daten eingesetzt. Statische und animierte, dreidimensionale Szenen, die ein
hohes Maß an Interaktion erlauben, ermöglichen dabei eine wesentlich leichtere
Vermittlung von theoretischen, abstrakten und komplexen Sachverhalten.
In der vorliegenden Arbeit wurden zum einen portable, sich an Internet-Standards
orientierende Methoden und Applikationen entwickelt, die eine dynamische und
interaktive 3D-Visualisierung chemischer Datenobjekte erlauben. Im Wesentlichen
wurden dabei drei unterschiedliche Client-Server-Strategien zur verteilten
Vermittlung und Visualisierung von Daten herausgearbeitet und in Form diverser
Applikationen eingesetzt.
Hybride Client-Server-Strategien ermöglichen eine ausgewogene Verteilung der
einzelnen Visualisierungsschritte zwischen Client und Server und gestatten
eine optimale Nutzung der sowohl Client- als auch Server-seitig vorhandenen
Hardware-Kapazitäten. Diese Strategie diente dabei in den Anwendungen VRML
File Creator for Chemical Structures, VRML-Animationsgenerator,
ComSpec3D
und MolSurf
als Grundlage für den Visualisierungsprozess. Der VRML
File Creator ermöglicht eine 3D-Darstellung molekularer Strukturen
und Eigenschaften unter Verwendung der Virtual
Reality Markup Language (VRML), wobei die Eingabe der entsprechenden
Strukturinformation durch einen Java-Editor, SMILES-Strings oder durch diverse,
chemische Austauschformate erfolgen kann. Neben der Realisierung verschiedener
Strukturdarstellungen ermöglicht der Service die codierte Einbettung von chemischen
Originaldaten wie beispielsweise Koordinaten oder molekularen Eigenschaften
in die dreidimensionale Szene, wodurch eine Weiterverarbeitung der Information
durch andere Applikationen gewährleistet ist. Der VRML-Animationsgenerator
gestattet die Generierung von molekularen VRML-Animationen und erlaubt somit
eine plattformunabhängige Darstellung von Reaktionspfaden und Moleküldynamiken.
Die Dateneingabe erfolgt dabei über das multiple XYZ-Trajektorienformat. Der
Online-Dienst ComSpec3D
wurde zur Darstellung von Raman- und IR-Spektren sowie der korrespondierenden
Normalschwingungen entwickelt. Er wurde dabei insbesondere für den Einsatz
an Universitäten und Schulen konzipiert. Die Applikation ermöglicht die Eingabe
fast beliebiger Strukturen und berechnet mit Hilfe des QM-Programms VAMP
Raman- und Infrarot-Spektren sowie die entsprechenden Daten der Normalschwingungen.
Der Benutzer kann sich anschließend für jeden Peak die zugehörige Normalschwingung
als animierte VRML-Szene anzeigen lassen, wobei auch der Einfluss der Kraftkonstante
auf die Schwingungsfrequenz dargestellt werden kann. Der Web-Service MolSurf
basiert ebenfalls auf einem hybriden Ansatz. MolSurf
ermöglicht die Berechnung und 3D-Visualisierung molekularer Oberflächen sowie
des elektrostatischen Potentials von fast beliebigen Molekülen. Die Oberfläche
kann dabei zum einen in verschiedenen Darstellungsformen als auch mit diversen
Farbpaletten dargestellt werden. Darüber hinaus enthält der Service Funktionen,
die einen normierten Vergleich von Oberflächeneigenschaften zwischen verschiedenen
Molekülen erlauben. Letztere Funktion ist insbesondere im Unterricht zur Verdeutlichung
von induktiven Effekten vorteilhaft.
Client-seitige Strategien verlagern den gesamten Visualisierungsprozess auf
den Client. Dabei müssen sowohl die chemischen Originaldaten als auch die
notwendigen Visualisierungsalgorithmen auf das Clientsystem transferiert werden.
Der wesentliche Vorteil dieses Ansatzes ist die Nutzung lokal vorhandener
Rechen- und Graphikressourcen, die insbesondere in den letzten Jahren eine
enorme Steigerung erfahren haben. Die Strategie bietet darüber hinaus das
größte Maß an Benutzerinteraktion. Ein entsprechender Ansatz wurde im Fall
der OrbVis-Applikation
genutzt. OrbVis
wurde ebenso wie ComSpec3D
zur Darstellung von quantenchemischen Zusammenhängen entwickelt und erlaubt
die portable und interaktive Berechnung und Visualisierung von Molekülorbitalen.
Nach Eingabe der Strukturinformation durch einen Java-Editor oder mittels
SMILES-Strings berechnet der Online-Dienst die zugehörigen Eigenwerte und
Orbitalkoeffizienten (VAMP).
Diese werden schließlich zusammen mit einem Java-Applet an den Client übermittelt.
Die Berechnung und dreidimensionale Darstellung der Molekülorbitale erfolgt
dabei vollständig auf dem Client. Der Benutzer kann darüber hinaus den Grenzwert
der Elektronendichte interaktiv verändern, was zu einer unmittelbaren Aktualisierung
der dreidimensionalen Szene führt.
In Server-seitigen Strategien erfolgt die Visualisierung vollständig auf dem
Server. Die erzeugten Einzelbilder werden dabei in einem kontinuierlichen
Datenstrom an den lokalen Rechner übertragen. Diese Strategie bietet sich
bei leistungsschwachen Clientsystemen, vertraulichen Originaldaten und vor
allem extrem großen Volumendaten an. Da entsprechend große Volumendaten zur
Zeit nur geringe bis keine Bedeutung in der chemischen Forschung haben, bestand
keine Notwendigkeit zur Implementierung entsprechender Applikationen.
Die durch automatisierte Laborsysteme generierte Informationsflut stellt den
Chemiker heute vor neue Herausforderungen. Insbesondere in der projektorientierten,
industriellen Forschung wird dabei ein einfacher und schneller Datenzugriff
sowie eine unkomplizierte und leichtverständliche Informationsanalyse zunehmend
wichtiger. Der Einsatz klassischer Data Mining-Methoden ist dabei nicht immer
sinnvoll, da die entsprechenden Ansätze häufig ein enormes Maß an Spezialwissen
und somit den Einsatz von Fachpersonal voraussetzen. Darüber hinaus handelt
es sich bei den klassischen Ansätzen häufig um sogenannte Black Box-Systeme,
die nur einen stark begrenzten Einblick sowie eine limitierte Beeinflussung
des Data Mining-Prozesses zulassen. Eine schnelle Analyse setzt jedoch die
Intuition und vor allem das Fachwissen des Experimentators voraus. Die Erfüllung
dieser Kriterien sowie ein einfacher und intuitiver Analyseprozess kann durch
Methoden des visuellen Data Minings gewährleistet werden.
Die Möglichkeiten des visuellen Data Minings wurden anhand des NCI
anti-Tumor Screening Data 3D Interfaces vorgestellt. Der Online-Dienst
wurde speziell zur visuellen Analyse von Struktur-Aktivitäts-Beziehungen in
der Antitumor-Screeningdatenbank des amerikanischen Krebsforschungsinstituts
entwickelt. Der Service erlaubt unter anderen Substruktur- und Ähnlichkeitssuchen
und stellt die biologischen Aktivitäten der resultierenden Verbindungen gegen
einen definierten Satz an Krebszelllinien mit Hilfe einer VRML-Szene dar.
Des Weiteren können in der Szene entdeckte, interessante Aktivitätsmuster
mit Hilfe dynamischer HTML-Formulare gefiltert und selektiert werden. Darüber
hinaus erlaubt der Service die Darstellung zusätzlicher Detailinformation.
Eine wesentlich breitere Verwendbarkeit und größere Anzahl spezieller, visueller
Data Mining-Werkzeuge bietet das im Rahmen dieser Arbeit entwickelte InfVis-Programm.
InfVis
basiert vor allem auf der 3D-Glyph-Technologie und erlaubt eine komfortable
Analyse von großen, multidimensionalen bzw. multivariaten Datensätzen. Die
einzelnen Datendimensionen werden dabei durch sogenannte retinale Eigenschaften
repräsentiert und die korrespondierenden Datenpunkte durch graphische Objekte
im dreidimensionalen Raum dargestellt. Die Applikation verfügt über eine breite
Auswahl an leistungsfähigen Filter- und Selektionswerkzeugen, wobei vor allem
den sogenannten Dynamic Query-Filtern
eine besondere Bedeutung im visuellen Data Mining-Prozess zukommt. Mit Hilfe
dieser Filter kann auch der unerfahrene Anwender schnell und interaktiv komplexe
Data Mining-Fragestellungen beantworten. Das InfVis-Programm
wurde vollständig in Java/Java3D entwickelt und kann daher sowohl als Standalone-
als auch Applet-Version betrieben werden.
Die portable Verwendbarkeit des InfVis-Programms
wurde am NCI
Screening Data 3D Miner gezeigt. Der Online-Dienst wurde als Weiterentwicklung
des bereits erwähnten NCI-Datenbank-Interfaces konzipiert und bietet im Gegensatz
dazu eine große Auswahl an unterschiedlichen Suchfunktionen. Der Benutzer
kann darüber hinaus eine Vielzahl an unterschiedlichen Datendimensionen in
den visuellen Data Mining-Prozess integrieren. Des Weiteren können zusätzliche
molekulare Eigenschaften mit in das Analyseverfahren einbezogen werden. Die
Darstellung und visuelle Exploration der generierten Datensätzte erfolgt schließlich
mit der Applet-Version des InfVis-Programms
auf der Client-Seite.
Die Fähigkeiten des visuellen Data Mining im Allgemeinen als auch der InfVis-Applikation
im Speziellen wurden im letzten Kapitel anhand von Anwendungsbeispielen demonstriert.
Dabei wurde zum einen mit Hilfe eines Reaktionsdatensatzes die Suche nach
geeigneten Reaktionsbedingungen zur Optimierung einer Reaktion untersucht.
In einem zweiten Beispiel wurde die visuelle Exploration und Identifikation
von Reaktionsbedingungen beschrieben, die zur Reaktionsplanung verwendet werden
können. Das letzte Anwendungsbeispiel verdeutlichte die Verwendbarkeit des
InfVis-Programms
zur Analyse von Struktur-Aktivitäts-Beziehungen in der Pharmaforschung.