Î:
De ce este utilă o matrice de confuzie în ML?
A:Există o serie de moduri de a vorbi despre motivul pentru care o matrice de confuzie este valoroasă în învățarea automată (ML) - dar unul dintre cele mai simple moduri este de a explica că matricea confuziei este o resursă de vizualizare a datelor.
O matrice de confuzie permite telespectatorilor să vadă dintr-o privire rezultatele utilizării unui clasificator sau a unui alt algoritm. Folosind un tabel simplu pentru a afișa rezultate analitice, matricea confuziei reduce esențial rezultatele într-o vedere mai digerabilă.
Matricea confuziei folosește terminologia specifică pentru a aranja rezultatele. Există adevărate pozitive și adevărate negative, precum și false pozitive și false negative. Pentru o matrice de confuzie mai complicată sau una bazată pe clasificarea comparativă, aceste valori ar putea fi arătate ca fiind clase reale și prezise pentru două obiecte distincte.
Indiferent de terminologia semantică, rezultatele sunt grupate într-un tabel pătrat (sau dreptunghiular).
Această vizualizare facilitează analistii să vadă cât de precis era un algoritm în clasificarea rezultatelor. (Citiți Generatori noi, pun algoritmi moderni să lucreze la art. ASCII.)
Utilitatea matricei de confuzie are legătură cu complexitatea proiectelor ML, precum și cu modul în care informația este formatată și livrată utilizatorilor. Imaginează-ți un șir de rezultate liniare incluzând false pozitive, false negative, adevărate pozitive și adevărate negative. (Citiți învățarea mașinii 101.)
Un utilizator ar trebui să tabuleze toate rezultatele liniare într-un grafic pentru a înțelege cum a funcționat algoritmul și cât de precis a fost acesta. Cu matricea confuziei, aceste informații sunt pur și simplu prezentate într-un model vizual puternic.
De exemplu, să presupunem că aparatul i se cere să clasifice 20 de imagini, dintre care cinci sunt fructe și cinci sunt legume. Dacă o matrice de confuzie ține următorul conținut (din stânga sus în sensul acelor de ceasornic): 7, 5, 3, 5, atunci matricea arată că șapte au fost identificate corect ca legume, în timp ce trei au fost clasificate corect ca fructe.
Celelalte 10, așa cum sunt reprezentate, sunt rezultate în care programul nu a reușit să identifice corect imaginea.
Matricea confuziei va fi utilă în tot felul de analize ML. Prin respectarea acestei resurse, utilizatorii pot descoperi cum să gestioneze probleme precum dimensionalitatea și adaptarea, precum și alte modalități de a optimiza un algoritm.