Das Ziel der Hauptkomponenten-Regression (Principal Component Regression=PCR) ist es, intrinsische Effekte in der Datenmatrix X zu extrahieren und diese Effekte zu nutzen um die Werte von Y vorherzusagen. PCR ist eine Kombination von PCA und MLRA. Zuerst wird eine PCA durchgeführt was zu einer Ladungsmatrix P (Loadingsmatrix) und eine Scorematrix T (Werte der neu berechneten Koordinaten) führt. Für die darauf folgende MLR werden nur die PCA-Scores zum Modellieren von Y benutzt. Die PCA Scores sind inhärent nicht-korreliert, damit sie direkt in der MLR angewandt werden können.

Die Auswahl der relevanten Effekte für die MLR kann in der PCR eine sehr komplexe Aufgabe darstellen. Ein direkter Ansatz hierzu ist es, die PCA Scores zu nehmen deren Varianz über einen Schwellwert liegt. Durch die Variation der Anzahl der benutzen PCA Komponenten, kann das Regressionsmodell optimiert werden. Sind die relevanten Effekte ziemlich klein, verglichen mit dem irrelevanten Effekt, werden sie nicht in die ersten Hauptkomponenten einbezogen. Dieses Problem kann durch die Anwendung der PLS gelöst werden.

BMBF-Leitprojekt Vernetztes Studium - Chemie