Hauptkomponenten-Regression
Das Ziel der Hauptkomponenten-Regression (Principal Component Regression=PCR)
ist es, intrinsische Effekte in der Datenmatrix X zu extrahieren
und diese Effekte zu nutzen um die Werte von Y vorherzusagen. PCR
ist eine Kombination von PCA und MLRA. Zuerst wird eine PCA durchgeführt
was zu einer Ladungsmatrix P (Loadingsmatrix) und eine Scorematrix
T (Werte der neu berechneten Koordinaten) führt. Für die
darauf folgende MLR werden nur die PCA-Scores zum Modellieren von
Y benutzt. Die PCA Scores sind inhärent nicht-korreliert, damit
sie direkt in der MLR angewandt werden können.
Die Auswahl der relevanten Effekte für die MLR kann in der PCR eine sehr komplexe Aufgabe darstellen. Ein direkter Ansatz hierzu ist es, die PCA Scores zu nehmen deren Varianz über einen Schwellwert liegt. Durch die Variation der Anzahl der benutzen PCA Komponenten, kann das Regressionsmodell optimiert werden. Sind die relevanten Effekte ziemlich klein, verglichen mit dem irrelevanten Effekt, werden sie nicht in die ersten Hauptkomponenten einbezogen. Dieses Problem kann durch die Anwendung der PLS gelöst werden.
© Prof. Dr. J. Gasteiger, Dr. Th. Engel, CCC Univ. Erlangen, Thu Apr 15 06:31:57 2004 GMT
BMBF-Leitprojekt Vernetztes Studium - Chemie
|