Kapitelanfang Vorige Seite Nächste Seite Nächstes Kapitel
VERN Home navigation
 
Chemoinformatik
Einführung in die Chemoinformatik
Repräsentation chemischer Strukturen
Repräsentation chemischer Reaktionen
Datentypen/Datenformate
Datenbanken/Datenquellen
Struktur-Suchmethoden
Berechnung physikalischer und chemischer Daten
Descriptoren für chemische Verbindungen
Methoden zur Datenanalyse
Einführung
Maschinelles Lernen
Lernverfahren
Entscheidungsbäume
Chemometrie
Multivariate Statistikmethoden
Korrelation
MLRA
PCA
PCR
PLS
MDS
Neuronale Netze
Fuzzy Logic
Genetische Algarithmen
Data Mining-Methoden in der Chemie
Weitere Data Mining-Methoden
Literatur
Anwendungen
Struktur-Eigenschafts-Beziehung
Strukturaufklärung
Synthesplanung

Startseite

Hauptkomponenten-Regression

Das Ziel der Hauptkomponenten-Regression (Principal Component Regression=PCR) ist es, intrinsische Effekte in der Datenmatrix X zu extrahieren und diese Effekte zu nutzen um die Werte von Y vorherzusagen. PCR ist eine Kombination von PCA und MLRA. Zuerst wird eine PCA durchgeführt was zu einer Ladungsmatrix P (Loadingsmatrix) und eine Scorematrix T (Werte der neu berechneten Koordinaten) führt. Für die darauf folgende MLR werden nur die PCA-Scores zum Modellieren von Y benutzt. Die PCA Scores sind inhärent nicht-korreliert, damit sie direkt in der MLR angewandt werden können.

Die Auswahl der relevanten Effekte für die MLR kann in der PCR eine sehr komplexe Aufgabe darstellen. Ein direkter Ansatz hierzu ist es, die PCA Scores zu nehmen deren Varianz über einen Schwellwert liegt. Durch die Variation der Anzahl der benutzen PCA Komponenten, kann das Regressionsmodell optimiert werden. Sind die relevanten Effekte ziemlich klein, verglichen mit dem irrelevanten Effekt, werden sie nicht in die ersten Hauptkomponenten einbezogen. Dieses Problem kann durch die Anwendung der PLS gelöst werden.


© Prof. Dr. J. Gasteiger, Dr. Th. Engel, CCC Univ. Erlangen, Thu Apr 15 06:31:57 2004 GMT
navigation BMBF-Leitprojekt Vernetztes Studium - Chemie