Cuprins:
Definiție - Ce înseamnă reducerea dimensionalității?
Reducerea dimensionalității este o serie de tehnici în învățarea mașinilor și a statisticilor pentru a reduce numărul de variabile aleatorii care trebuie luate în considerare. Ea implică selectarea funcțiilor și extragerea funcțiilor. Reducerea dimensionalității face ca analiza datelor să fie mult mai ușoară și mai rapidă pentru algoritmii de învățare automată, fără variabile străine de procesat, făcând la rândul lor algoritmi de învățare automată mai rapid și mai simplu.
Techopedia explică reducerea dimensionalității
Reducerea dimensionalității încearcă să reducă numărul de variabile aleatorii din date. O abordare K-cea mai apropiată de vecini este adesea folosită. Tehnicile de reducere a dimensionalității sunt împărțite în două mari categorii: selectarea caracteristicilor și extragerea caracteristicilor.
Tehnicile de selecție a caracteristicilor găsesc un subset mai mic al unui set de date multidimensionale pentru a crea un model de date. Principalele strategii pentru setul de funcții sunt filtrul, ambalajul (folosind un model predictiv) și încorporat, care realizează selectarea funcțiilor în timp ce construiești un model.
Extragerea caracteristicilor presupune transformarea datelor de înaltă dimensiune în spații cu dimensiuni mai puține. Metodele includ analiza principală a componentelor, PCA a kernel-ului, PCA pe nucleul bazat pe grafic, analiza discriminantă liniară și analiza discriminantă generalizată.









