Cuprins:
- Definiție - Ce înseamnă Analiza Componentelor Principale (PCA)?
- Techopedia explică analiza componentelor principale (PCA)
Definiție - Ce înseamnă Analiza Componentelor Principale (PCA)?
Analiza componentelor principale (PCA) este o tehnică folosită pentru identificarea unui număr mai mic de variabile necorelate cunoscute ca componente principale dintr-un set mai mare de date. Tehnica este utilizată pe scară largă pentru a sublinia variația și a capta tipare puternice într-un set de date. Inventată de Karl Pearson în 1901, analiza componentelor principale este un instrument utilizat în modelele predictive și în analiza datelor exploratorii. Analiza componentelor principale este considerată o metodă statistică utilă și utilizată în domenii precum compresia imaginii, recunoașterea feței, neuroștiința și grafică computerizată.
Techopedia explică analiza componentelor principale (PCA)
Analiza componentelor principale ajută la facilitarea explorării și vizualizării datelor. Este o tehnică simplă non-parametrică pentru extragerea informațiilor din seturi de date complexe și confuze. Analiza componentelor principale este concentrată pe cantitatea maximă de varianță cu cel mai puțin număr de componente principale. Unul dintre avantajele distincte asociate cu analiza componentelor principale este că, odată ce modelele sunt găsite în datele respective, compresia datelor este de asemenea suportată. Se folosește analiza componentelor principale pentru a elimina numărul de variabile sau atunci când există prea mulți predictori în comparație cu numărul de observații sau pentru a evita multicollinearitatea. Este strâns legat de analiza corelațională canonică și folosește transformarea ortogonală pentru a converti setul de observații care conțin variabile corelate într-un set de valori cunoscute sub numele de componente principale. Numărul de componente principale utilizate în analiza componentelor principale este mai mic sau egal cu numărul mai mic de observații. Analiza componentelor principale este sensibilă la scalarea relativă a variabilelor utilizate inițial.
Analiza componentelor principale este utilizată pe scară largă în multe domenii precum cercetarea de piață, științele sociale și în industriile în care sunt utilizate seturi de date mari. Tehnica poate ajuta și la furnizarea unei imagini cu dimensiuni inferioare ale datelor originale. Doar un efort minim este necesar în cazul analizei componentelor principale pentru reducerea unui set de date complexe și confuze într-un set de informații utile simplificate.