PREV
NEXT

Kapitel 8
Zusammenfassung
Neben der praktischen Labortätigkeit zeichnet sich die chemische Forschung in der Regel durch die schnelle, zuverlässige und vollständige Abfrage und Analyse von bereits bestehenden Literaturangaben, Lehrbuchwissen sowie Struktur- und Aktivitätsdaten aus. Während in den Anfängen der klassischen Chemie lediglich auf papierbasierte, zweidimensionale Strukturdaten und textuelle Information zugegriffen wurde, reichen solche Darstellungsformen und Medien heute insbesondere in der Pharmaforschung und Biochemie nicht mehr zum Verständnis und zur Analyse komplexer Sachverhalte aus. Zur Lösung dieser Problematik nutzen Chemiker daher seit langem die Möglichkeiten der computergestützten Visualisierung, wobei heute eine fast unüberschaubare Auswahl an kommerziellen und frei verfügbaren Anwendungen zur Darstellung und visuellen Analyse von molekularen Eigenschaften, Oberflächen und Dynamiken zur Verfügung steht. Diese Applikationen dienen jedoch in der Regel zur Lösung einzelner, spezifischer Frage- und Problemstellungen und sind im Allgemeinen zueinander nicht kompatibel, was den essentiellen Informationsfluss und -austausch von chemischen Daten stark beeinträchtigt oder sogar verhindert. Insbesondere seit der durch automatisierte Laborsysteme generierten Informationsflut hat diese Situation an Brisanz gewonnen. Um einen einfachen, standardisierten und Datenzugriff zu gewährleisten, kommen in der chemischen Industrie heute zunehmend portable Informationsmanagement- und Visualisierungs-Systeme zum Einsatz. Da die bis dato erhältlichen portablen Standardapplikationen zur Visualisierung chemischer Daten lediglich einfache, rudimentäre Strukturdarstellungen sowie in Ausnahmefällen auch eine begrenzte Visualisierung komplexer Datenobjekte wie Oberflächen erlauben, ist die Entwicklung plattformunabhängiger Visualisierungsanwendungen heute dringend erforderlich.
Das Potential interaktiver und portabler Visualisierungssoftware wurde dabei nicht nur in der chemischen Industrie erkannt, sondern wird in zunehmenden Maße von akademischen Einrichtungen zur didaktischen Vermittlung von chemischen Daten eingesetzt. Statische und animierte, dreidimensionale Szenen, die ein hohes Maß an Interaktion erlauben, ermöglichen dabei eine wesentlich leichtere Vermittlung von theoretischen, abstrakten und komplexen Sachverhalten.
In der vorliegenden Arbeit wurden zum einen portable, sich an Internet-Standards orientierende Methoden und Applikationen entwickelt, die eine dynamische und interaktive 3D-Visualisierung chemischer Datenobjekte erlauben. Im Wesentlichen wurden dabei drei unterschiedliche Client-Server-Strategien zur verteilten Vermittlung und Visualisierung von Daten herausgearbeitet und in Form diverser Applikationen eingesetzt.
Hybride Client-Server-Strategien ermöglichen eine ausgewogene Verteilung der einzelnen Visualisierungsschritte zwischen Client und Server und gestatten eine optimale Nutzung der sowohl Client- als auch Server-seitig vorhandenen Hardware-Kapazitäten. Diese Strategie diente dabei in den Anwendungen VRML File Creator for Chemical Structures, VRML-Animationsgenerator, ComSpec3D und MolSurf als Grundlage für den Visualisierungsprozess. Der VRML File Creator ermöglicht eine 3D-Darstellung molekularer Strukturen und Eigenschaften unter Verwendung der Virtual Reality Markup Language (VRML), wobei die Eingabe der entsprechenden Strukturinformation durch einen Java-Editor, SMILES-Strings oder durch diverse, chemische Austauschformate erfolgen kann. Neben der Realisierung verschiedener Strukturdarstellungen ermöglicht der Service die codierte Einbettung von chemischen Originaldaten wie beispielsweise Koordinaten oder molekularen Eigenschaften in die dreidimensionale Szene, wodurch eine Weiterverarbeitung der Information durch andere Applikationen gewährleistet ist. Der VRML-Animationsgenerator gestattet die Generierung von molekularen VRML-Animationen und erlaubt somit eine plattformunabhängige Darstellung von Reaktionspfaden und Moleküldynamiken. Die Dateneingabe erfolgt dabei über das multiple XYZ-Trajektorienformat. Der Online-Dienst ComSpec3D wurde zur Darstellung von Raman- und IR-Spektren sowie der korrespondierenden Normalschwingungen entwickelt. Er wurde dabei insbesondere für den Einsatz an Universitäten und Schulen konzipiert. Die Applikation ermöglicht die Eingabe fast beliebiger Strukturen und berechnet mit Hilfe des QM-Programms VAMP Raman- und Infrarot-Spektren sowie die entsprechenden Daten der Normalschwingungen. Der Benutzer kann sich anschließend für jeden Peak die zugehörige Normalschwingung als animierte VRML-Szene anzeigen lassen, wobei auch der Einfluss der Kraftkonstante auf die Schwingungsfrequenz dargestellt werden kann. Der Web-Service MolSurf basiert ebenfalls auf einem hybriden Ansatz. MolSurf ermöglicht die Berechnung und 3D-Visualisierung molekularer Oberflächen sowie des elektrostatischen Potentials von fast beliebigen Molekülen. Die Oberfläche kann dabei zum einen in verschiedenen Darstellungsformen als auch mit diversen Farbpaletten dargestellt werden. Darüber hinaus enthält der Service Funktionen, die einen normierten Vergleich von Oberflächeneigenschaften zwischen verschiedenen Molekülen erlauben. Letztere Funktion ist insbesondere im Unterricht zur Verdeutlichung von induktiven Effekten vorteilhaft.
Client-seitige Strategien verlagern den gesamten Visualisierungsprozess auf den Client. Dabei müssen sowohl die chemischen Originaldaten als auch die notwendigen Visualisierungsalgorithmen auf das Clientsystem transferiert werden. Der wesentliche Vorteil dieses Ansatzes ist die Nutzung lokal vorhandener Rechen- und Graphikressourcen, die insbesondere in den letzten Jahren eine enorme Steigerung erfahren haben. Die Strategie bietet darüber hinaus das größte Maß an Benutzerinteraktion. Ein entsprechender Ansatz wurde im Fall der OrbVis-Applikation genutzt. OrbVis wurde ebenso wie ComSpec3D zur Darstellung von quantenchemischen Zusammenhängen entwickelt und erlaubt die portable und interaktive Berechnung und Visualisierung von Molekülorbitalen. Nach Eingabe der Strukturinformation durch einen Java-Editor oder mittels SMILES-Strings berechnet der Online-Dienst die zugehörigen Eigenwerte und Orbitalkoeffizienten (VAMP). Diese werden schließlich zusammen mit einem Java-Applet an den Client übermittelt. Die Berechnung und dreidimensionale Darstellung der Molekülorbitale erfolgt dabei vollständig auf dem Client. Der Benutzer kann darüber hinaus den Grenzwert der Elektronendichte interaktiv verändern, was zu einer unmittelbaren Aktualisierung der dreidimensionalen Szene führt.
In Server-seitigen Strategien erfolgt die Visualisierung vollständig auf dem Server. Die erzeugten Einzelbilder werden dabei in einem kontinuierlichen Datenstrom an den lokalen Rechner übertragen. Diese Strategie bietet sich bei leistungsschwachen Clientsystemen, vertraulichen Originaldaten und vor allem extrem großen Volumendaten an. Da entsprechend große Volumendaten zur Zeit nur geringe bis keine Bedeutung in der chemischen Forschung haben, bestand keine Notwendigkeit zur Implementierung entsprechender Applikationen.
Die durch automatisierte Laborsysteme generierte Informationsflut stellt den Chemiker heute vor neue Herausforderungen. Insbesondere in der projektorientierten, industriellen Forschung wird dabei ein einfacher und schneller Datenzugriff sowie eine unkomplizierte und leichtverständliche Informationsanalyse zunehmend wichtiger. Der Einsatz klassischer Data Mining-Methoden ist dabei nicht immer sinnvoll, da die entsprechenden Ansätze häufig ein enormes Maß an Spezialwissen und somit den Einsatz von Fachpersonal voraussetzen. Darüber hinaus handelt es sich bei den klassischen Ansätzen häufig um sogenannte Black Box-Systeme, die nur einen stark begrenzten Einblick sowie eine limitierte Beeinflussung des Data Mining-Prozesses zulassen. Eine schnelle Analyse setzt jedoch die Intuition und vor allem das Fachwissen des Experimentators voraus. Die Erfüllung dieser Kriterien sowie ein einfacher und intuitiver Analyseprozess kann durch Methoden des visuellen Data Minings gewährleistet werden.
Die Möglichkeiten des visuellen Data Minings wurden anhand des NCI anti-Tumor Screening Data 3D Interfaces vorgestellt. Der Online-Dienst wurde speziell zur visuellen Analyse von Struktur-Aktivitäts-Beziehungen in der Antitumor-Screeningdatenbank des amerikanischen Krebsforschungsinstituts entwickelt. Der Service erlaubt unter anderen Substruktur- und Ähnlichkeitssuchen und stellt die biologischen Aktivitäten der resultierenden Verbindungen gegen einen definierten Satz an Krebszelllinien mit Hilfe einer VRML-Szene dar. Des Weiteren können in der Szene entdeckte, interessante Aktivitätsmuster mit Hilfe dynamischer HTML-Formulare gefiltert und selektiert werden. Darüber hinaus erlaubt der Service die Darstellung zusätzlicher Detailinformation.
Eine wesentlich breitere Verwendbarkeit und größere Anzahl spezieller, visueller Data Mining-Werkzeuge bietet das im Rahmen dieser Arbeit entwickelte InfVis-Programm. InfVis basiert vor allem auf der 3D-Glyph-Technologie und erlaubt eine komfortable Analyse von großen, multidimensionalen bzw. multivariaten Datensätzen. Die einzelnen Datendimensionen werden dabei durch sogenannte retinale Eigenschaften repräsentiert und die korrespondierenden Datenpunkte durch graphische Objekte im dreidimensionalen Raum dargestellt. Die Applikation verfügt über eine breite Auswahl an leistungsfähigen Filter- und Selektionswerkzeugen, wobei vor allem den sogenannten Dynamic Query-Filtern eine besondere Bedeutung im visuellen Data Mining-Prozess zukommt. Mit Hilfe dieser Filter kann auch der unerfahrene Anwender schnell und interaktiv komplexe Data Mining-Fragestellungen beantworten. Das InfVis-Programm wurde vollständig in Java/Java3D entwickelt und kann daher sowohl als Standalone- als auch Applet-Version betrieben werden.
Die portable Verwendbarkeit des InfVis-Programms wurde am NCI Screening Data 3D Miner gezeigt. Der Online-Dienst wurde als Weiterentwicklung des bereits erwähnten NCI-Datenbank-Interfaces konzipiert und bietet im Gegensatz dazu eine große Auswahl an unterschiedlichen Suchfunktionen. Der Benutzer kann darüber hinaus eine Vielzahl an unterschiedlichen Datendimensionen in den visuellen Data Mining-Prozess integrieren. Des Weiteren können zusätzliche molekulare Eigenschaften mit in das Analyseverfahren einbezogen werden. Die Darstellung und visuelle Exploration der generierten Datensätzte erfolgt schließlich mit der Applet-Version des InfVis-Programms auf der Client-Seite.
Die Fähigkeiten des visuellen Data Mining im Allgemeinen als auch der InfVis-Applikation im Speziellen wurden im letzten Kapitel anhand von Anwendungsbeispielen demonstriert. Dabei wurde zum einen mit Hilfe eines Reaktionsdatensatzes die Suche nach geeigneten Reaktionsbedingungen zur Optimierung einer Reaktion untersucht. In einem zweiten Beispiel wurde die visuelle Exploration und Identifikation von Reaktionsbedingungen beschrieben, die zur Reaktionsplanung verwendet werden können. Das letzte Anwendungsbeispiel verdeutlichte die Verwendbarkeit des InfVis-Programms zur Analyse von Struktur-Aktivitäts-Beziehungen in der Pharmaforschung.

PREV
NEXT

Copyright © 2003, Frank Oellien, Universität Erlangen-Nürnberg. All rights reserved.