Kapitelanfang Vorige Seite Nächste Seite Nächstes Kapitel
VERN Home navigation
 
Chemoinformatik
Einführung in die Chemoinformatik
Repräsentation chemischer Strukturen
Repräsentation chemischer Reaktionen
Datentypen/Datenformate
Datenbanken/Datenquellen
Struktur-Suchmethoden
Berechnung physikalischer und chemischer Daten
Descriptoren für chemische Verbindungen
Methoden zur Datenanalyse
Einführung
Maschinelles Lernen
Lernverfahren
Entscheidungsbäume
Chemometrie
Multivariate Statistikmethoden
Korrelation
MLRA
PCA
PCR
PLS
MDS
Neuronale Netze
Fuzzy Logic
Genetische Algarithmen
Data Mining-Methoden in der Chemie
Weitere Data Mining-Methoden
Literatur
Anwendungen
Struktur-Eigenschafts-Beziehung
Strukturaufklärung
Synthesplanung

Startseite

Korrelation

Ein erster Schritt im Datenanalyse-Prozeß ist das Erkennen des Zusammenhangs von Variablen - die Korrelationsanalyse.
Die Höhe der Variablenabhängigkeit wir durch den Korrelationskoeffizienten bestimmt und ist nach Pearson:

Der Wert des Korrelationskoeffizienten bewegt sich zwischen r=-1 und r=+1. Die Daten sind vollständig korreliert (positiv oder negativ) wenn |r|=1. Je kleiner der absolute Wert r ist, desto kleiner ist die Korrelation innerhalb der Daten.

vollständige, positive Korrelation Ein Korrelationskoeffizient von r=+1 bedeutet daß eine vollständige, positive, lineare Beziehung vorliegt. Große Werte auf der x-Achse sind mit großen Werten auf der y-Achse verbunden.
vollständige, negative Korrelation Wenn der Korrelationskoeffizient r=-1 ist, sind große Werte auf der x-Achse mit kleinen Werten auf der y-Achse verbunden. Die Beziehung ist vollständig, negativ, linear.
keine Korrelation Sind die x und y Werte komplett unabhängig voneinander, ist der Korrelationskoeffizient r=0.

 

Anwendung:

Eine Anwendung der Korrelationsanalyse ist das Auffinden von verwandten chemischen Deskriptoren. Sind zwei Deskriptoren stark korreliert, d.h. überschreitet der Korrelationskoeffizient beider Deskriptoren einen bestimmten Wert z.B. r>0.90, kann einer der Deskriptoren vom Datensatz ausgeschlossen werden.


© Prof. Dr. J. Gasteiger, Dr. Th. Engel, CCC Univ. Erlangen, Thu Apr 15 06:31:57 2004 GMT
navigation BMBF-Leitprojekt Vernetztes Studium - Chemie