Î:
Care este diferența dintre învățarea supravegheată, nesupravegheată și semi-supravegheată?
A:Diferența cheie între învățarea supravegheată și nesupravegheată în învățarea automată este utilizarea datelor de instruire.
Învățarea supravegheată folosește exemple de date pentru a arăta cum arată datele „corecte”. Datele sunt structurate pentru a afișa rezultatele intrărilor date.
Un algoritm de învățare automată care clasifică fructele ar putea avea imagini cu fructe, cum ar fi mere, banane, struguri și portocale ca intrări și numele acestor fructe ca rezultate.
Un exemplu în lumea reală ar fi filtrele de spam Bayesiene din programele de e-mail. Aceste filtre sunt instruite cu exemple de e-mailuri care sunt considerate spam. Filtrul de spam poate căuta anumite fraze care apar în e-mailurile care apar în e-mailurile spam și le poate muta într-un folder de spam.
Este ca și cum ai arăta unui om cum să facă o nouă sarcină. O persoană care face introducerea datelor i-ar putea fi prezentate exemple de date într-un format pe care compania îl dorește și este de așteptat să le urmeze.
Programele de învățare automată care utilizează învățarea supraveghează se repetă de multe ori cu datele de instruire. Rezultatele pot fi impresionante atunci când intră într-adevăr. Filtrul de spam Gmail al Google este foarte precis, deoarece există atât de mulți utilizatori care îl instruiesc.
Învățarea nesupravegheată nu are date de pregătire anterioară. În exemplul nostru de clasificare a fructelor, un algoritm ar putea fi afișat doar imagini cu fructe și spus să le clasifice.
Învățarea nesupravegheată are aplicații în cercetarea de piață prin învățarea obiceiurilor de cumpărare a clienților sau a securității prin monitorizarea tiparelor de hacking.
Învățarea semi-supravegheată încearcă să ia un teren de mijloc prin etichetarea unor date. De exemplu, mărul și portocala pot fi etichetate în programul de clasificare a fructelor, dar banana și strugurii nu sunt.
Când să folosiți oricare dintre acești algoritmi va depinde de tipul de date utilizate. Unele sarcini au modele stabile, precum frauda cu cardul de credit sau mesajele spam. Învățarea supravegheată este potrivită pentru aceste tipuri de sarcini. Atacurile în rețea sunt imprevizibile, iar metodele de învățare nesupravegheate sau semi-supravegheate pot fi mai potrivite.