Previous PageNext Page

6. Überblick über Anwendungen neuronaler Netze in der Chemie

Bei einer Vielfalt von Problemen aus den verschiedensten Bereichen der Chemie wurde bereits versucht, Lösungen unter Verwendung neuronaler Netze zu finden: Das geht von so umfassenden Themen wie Struktur-Spektren-Beziehungen, chemische Reaktivität, Sekundär- und Tertiärstruktur von Proteinen sowie Prozeßkontrolle bis hin zu ganz speziellen Einzelfragen wie der Klassifizierung der Energieniveaus des Curiumatoms, dem Erkennen und Klassifizieren von Aerosolteilchenverteilungen sowie dem Zusammenhang zwischen der physikalischen Struktur und den mechanischen Eigenschaften von Polyethylenterephthalatgarnen. Diese Vielfalt unterstreicht, daß neuronale Netze ganz allgemeine, breit einsetzbare Methoden zur Lösung von Problemen darstellen. Die konkrete Anwendung wird erst durch die Art der Daten, die in ein neuronales Netz eingegeben werden, bestimmt.
Dieser Artikel will ein Gefühl dafür vermitteln, welche Art von Problemen mit neuronalen Netzen bearbeitet werden kann, und damit den Leser in die Lage versetzen zu entscheiden, ob er diese Methoden für seine Aufgabenstellungen verwenden kann. Ziel ist also, die Leistungsfähigkeiten der Methoden aufzuzeigen und Anreize zu weiteren Anwendungen zu geben, und nicht so sehr, einen umfassenden Überblick über die bisherigen Arbeiten zu vermitteln.
Die im folgenden präsentierte Auswahl typischer Anwendungen neuronaler Netze in der Chemie ist nicht nach Anwendungsgebieten, sondern nach Problemtypen gegliedert, d.h. die Arbeiten sind danach eingeordnet, ob es sich um Aufgaben zur Klassifikation, Modellierung, Assoziation oder Abbildung handelt.
Es gibt natürlich eine Reihe von Methoden, die alternativ zu neuronalen Netzen eingesetzt werden können - und seit vielen Jahren auch erfolgreich verwendet werden. Viele Aufgaben, für die heute neuronale Netze herangezogen werden, können auch mit statistischen und Mustererkennungs(Pattern recognition)-Methoden wie Regressionsanalyse, Clustermethoden und Hauptkomponentenanalyse gelöst werden. In vielen Fällen dürften diese Methoden zu ebenso guten Ergebnissen führen, und man vermißt leider in den meisten Arbeiten über neuronale Netze eine Gegenüberstellung der Leistungsfähigkeit dieser Netze und der etablierter Methoden. Solche Vergleiche könnten die spezifischen Vorteile neuronaler Netze stärker herausarbeiten. Dazu gehören:

-

die mathematische Form der Beziehung zwischen den Eingabe- und Ausgabedaten muß nicht vorgegeben werden

-

neuronale Netze können auch nichtlineare Beziehungen aufstellen

In jedem Fall sollte man beim Einsatz neuronaler Netze die gleiche Sorgfalt bei der Problemformulierung, der Repräsentation der Information, der Auswahl der Daten und der Aufteilung der Daten in Trainings- und Testdatensatz verwenden, wie sie bei statistischen und Mustererkennungsmethoden notwendig ist. Es muß ganz deutlich gesagt werden, daß die Qualität der Ergebnisse mit neuronalen Netzen entscheidend davon abhängt, welche Mühe und Arbeit man in diese Teilaspekte steckt.
Die wesentlichen Gesichtspunkte, die man vor dem Einsatz eines bestimmten neuronalen Netzes erwägen soll, sind:

-

Welcher Typ einer Aufgabenstellung liegt vor? Klassifikation, Modellierung, Assoziation oder Abbildung?

-

Welches Lernverfahren kann gewählt werden? Mit oder ohne Unterweisung? Sind also für einen Satz an Objekten die zu erwartenden Ergebnisse bekannt, oder soll die Struktur einer Information erst gefunden werden?

In Tabelle 1 sind die Netzvarianten mit den Problemtypen und Lernverfahren verknüpft, damit leichter entschieden werden kann, welches neuronale Netz für eine konkrete Problemlösung eingesetzt werden soll.

Tabelle 1. Verwendungsmöglichkeiten neuronaler Netze.

 

Hopfield- Netz

ABAM

Kohonen- Netz

Backpropagation

Klassifikation

 

x

x

x

Modellierung

     

x

Assoziation

x

x

 

x

Abbildung

   

x

 

Lernverfahren [a]

ohne

ohne + mit

ohne

mit

[a] ohne = ohne Unterweisung, mit = mit Unterweisung (siehe Abshnitt 4)

In der Chemie stellen sich meistens Klassifikations- und Modellierungsaufgaben. Dies ist einer der Gründe, weshalb Mehrschichtennetze, die mit dem Backpropagation-Algorithmus trainiert werden, dominieren. Eine Zusammenstellung der bis Ende 1990 erschienenen Anwendungen neuronaler Netze in der Chemie ergab, daß über 90 % der Arbeiten den Backpropagation-Algorithmus einsetzen [2]. Ein Hopfield-Netz wurde nur zweimal, ein adaptiver bidirektionaler assoziativer Speicher nur einmal und ein Kohonen-Netz, gekoppelt mit dem Counterpropagation-Lernverfahren, ebenfalls nur einmal verwendet. Diese Verteilung sollte aber für die Zukunft nicht unbedingt so bleiben. ABAM und Kohonen-Netz sowie der Counterpropagation-Algorithmus bieten Möglichkeiten, die bei weitem noch nicht ausgeschöpft wurden.
Bleibt man beim Mehrschichtenmodell mit dem Backpropagation-Algorithmus, so findet man ein breites Spektrum in der Komplexität der eingesetzten Netze: von Netzen mit 20 Gewichten bis zu solchen mit 40000, in einem Fall sogar mit 500000 Gewichten! Die Zahl der zum Training eines Netzes verwendeten Daten sollte beim Backpropagation-Algorithmus mindestens so groß sein wie die Zahl der Gewichte. Diese Regel wurde bei weitem nicht immer eingehalten. Auch die Zahl der Iterationen, mit der der gesamte Datensatz zum Training über das Netz geschickt wurde (Zahl der Epochen), schwankt beachtlich: von 20 bis zu 100000 Iterationen. Es läßt sich denken, daß die Trainingszeiten mit der Zahl der Gewichte und der Zahl der Epochen stark zunehmen: von wenigen Minuten auf einem Personal Computer bis zu Stunden auf einem Cray- Supercomputer.

Previous PageNext Page


Johann.Gasteiger@chemie.uni-erlangen.de