Î:
De ce bagajul în învățarea mașinii scade variația?
A:Agregarea bootstrap, sau „bagging”, în învățarea mașinii scade variația prin construirea de modele mai avansate de seturi de date complexe. Mai exact, abordarea de bagaj creează subseturi care se suprapun adesea pentru a modela datele într-un mod mai implicat.
O noțiune interesantă și simplă despre cum se aplică bagajul este de a lua un set de probe aleatorii și de a extrage media simplă. Apoi, folosind același set de eșantioane, creați zeci de subseturi construite ca arbori de decizie pentru a manipula rezultatele eventuale. A doua medie trebuie să arate o imagine mai reală a modului în care aceste probe individuale se raportează între ele în termeni de valoare. Aceeași idee poate fi aplicată oricărei proprietăți a oricărui set de puncte de date.
Descărcare gratuită: învățarea mașinii și de ce contează |
Întrucât această abordare consolidează descoperirea în granițe mai definite, aceasta scade variația și ajută la suprapunere. Gândiți-vă la o diagramă de distribuție cu puncte de date oarecum distribuite; prin utilizarea unei metode de bagajare, inginerii „micșorează” complexitatea și orientează liniile de descoperire către parametri mai netezi.
Unii vorbesc despre valoarea bagajului ca „împărțire și cucerire” sau un tip de „euristică asistată”. Ideea este că, prin modelarea ansamblurilor, cum ar fi utilizarea pădurilor aleatorii, cei care folosesc bagajul ca tehnică pot obține rezultate de date mai reduse. În ceea ce privește micșorarea complexității, pungile pot ajuta, de asemenea, la supraîncadrare. Gândiți-vă la un model cu prea multe puncte de date: să zicem, conectare-punctele cu 100 de puncte nealiniate. Linia de date vizuală rezultată va fi zimțată, dinamică, volatilă. Apoi „eliminați” varianța punând laolaltă seturi de evaluări. În învățarea în ansamblu, acest lucru este adesea gândit ca fiind alături de mai mulți „studenți slabi” pentru a oferi un rezultat de colaborare „învățare puternică”. Rezultatul este o linie de date mai lină, mai conturată și o variație mai puțin sălbatică a modelului.
Este ușor de observat cum ideea de bagaj poate fi aplicată sistemelor IT de întreprindere. Liderii de afaceri doresc adesea o „viziune a păsării” a ceea ce se întâmplă cu produse, clienți etc. pentru utilizatorii finali.