Î:
Care este un mod simplu de a descrie prejudecățile și variația în învățarea mașinii?
A:Există un număr de moduri complicate de a descrie prejudecățile și variația în învățarea automată. Multe dintre ele utilizează ecuații matematice semnificativ complexe și arată prin grafic cum sunt exemple specifice reprezentând diferite cantități atât de părtinire, cât și de varianță.
Iată un mod simplu de a descrie prejudecata, variația și compromisul dintre prejudecăți / variații în învățarea mașinii.
La baza sa, prejudecata este o simplificare excesivă. Poate fi important să adăugați la definiția prejudecății o presupunere sau o eroare asumată.
Dacă un rezultat extrem de părtinitor nu ar fi greșit - dacă ar fi pe bani - ar fi extrem de precis. Problema este că modelul simplificat conține o eroare, deci nu este pe ochiul taurului - eroarea semnificativă continuă să fie repetată sau chiar amplificată pe măsură ce programul de învățare automată funcționează.
Definiția simplă a variației este că rezultatele sunt prea împrăștiate. Acest lucru duce adesea la o supracomplexitate a programului și la probleme între testele și seturile de antrenament.
Variatia mare inseamna ca modificarile mici creeaza schimbari mari in rezultate sau rezultate.
Un alt mod de a descrie pur și simplu variația este că în model există prea mult zgomot și astfel devine mai greu ca programul de învățare automată să izoleze și să identifice semnalul real.
Așadar, una dintre cele mai simple metode de a compara prejudecata și variația este de a sugera că inginerii de învățare în mașini trebuie să parcurgă o linie fină între prea multă prejudecată sau o simplificare prea mare și o prea mare varianță sau preacomplexitate.
Un alt mod de a reprezenta această fântână este cu un grafic în patru cvadrate care prezintă toate combinațiile de varianță mare și joasă. În cadrul cadranului cu părtinire redusă / variație scăzută, toate rezultatele sunt reunite într-un cluster precis. Într-un rezultat de părtinire mare / varianță scăzută, toate rezultatele sunt reunite într-un grup inexact. Într-un rezultat de părtinire scăzută / varianță ridicată, rezultatele sunt împrăștiate în jurul unui punct central care ar reprezenta un cluster precis, în timp ce într-un rezultat cu o părtinire mare / varianță ridicată, punctele de date sunt atât împrăștiate cât și incorecte colectiv.