Acasă Dezvoltare Cum poate informa conceptul de echilibru pentru proiectele de învățare automată?

Cum poate informa conceptul de echilibru pentru proiectele de învățare automată?

Anonim

Î:

Cum poate informa conceptul de echilibru pentru proiectele de învățare automată?

A:

În general, un echilibru va informa învățarea mașinii prin încercarea de a stabiliza mediile de învățare automată și va crea rezultate cu un amestec compatibil de componente deterministe și probabilistice.

Experții descriu un „echilibru” ca o situație în care actorii raționali dintr-un sistem de învățare automată ajung la un consens asupra acțiunii strategice - în special, echilibrul Nash în teoria jocurilor implică doi sau mai mulți dintre acești actori raționali care consolidează strategiile prin recunoașterea faptului că niciun jucător nu beneficiază de schimbarea unei strategii anume dacă ceilalți jucători nu le schimbă a lor.

Descărcare gratuită: învățarea mașinii și de ce contează

O demonstrație deosebit de populară și simplă a echilibrului Nash implică o matrice simplă în care doi jucători aleg fiecare un rezultat binar.

Cele de mai sus sunt un mod destul de tehnic de a descrie echilibrul și modul în care funcționează. O modalitate mult mai informală de a ilustra conceptul de echilibru, în special exemplul de mai sus al doi actori raționali având fiecare alegere binară, este să te gândești la ceea ce ai putea numi „mersul unul către celălalt pe holul liceului”.

Să presupunem că două persoane se plimbă pe direcții diferite pe un hol al liceului (sau orice alt tip de zonă), care are loc doar pentru două persoane, în funcție de lățime. Cele două căi deschise sunt rezultatele binare. Dacă cei doi actori raționali aleg rezultate binare diferite care nu intră în conflict între ei, se vor trece unul pe celălalt și se vor saluta. Dacă aleg două rezultate binare conflictuale - se plimbă în același spațiu, iar unul dintre ei va trebui să cedeze.

În exemplul de mai sus, dacă cei doi actori raționali aleg cele două rezultate compatibile și non-conflictuale, consensul general este că niciunul nu câștigă schimbându-și strategia - în acest caz direcțiile de mers - dacă cealaltă persoană nu le schimbă.

Cele de mai sus constituie un echilibru care poate fi modelat în orice construcție de învățare automată. Având în vedere acest exemplu simplu, rezultatul va fi întotdeauna cei doi actori raționali care cooperează, sau cu alte cuvinte, două persoane care trec pe lângă ele.

Dimpotrivă, s-ar putea numi „dezechilibru” - dacă cei doi actori raționali aleg rezultate conflictuale, după cum am menționat, unul dintre ei va trebui să cedeze. Cu toate acestea, programul ML care modelează acest lucru ar putea fi aruncat într-o buclă infinită dacă ambele decid să cedeze - la fel ca două persoane să se deplaseze pentru a încerca să se acomodeze reciproc și continuă să meargă spre coliziune.

Echilibrele precum cea de mai sus vor fi utilizate în general în învățarea automată pentru a crea consens și stabilizarea modelelor. Inginerii și dezvoltatorii vor căuta acele scenarii și situații care beneficiază de echilibre și vor lucra pentru schimbarea sau gestionarea celor care nu. Analizând exemple din lumea reală care corespund echilibrelor ML, este ușor de observat cum acest tip de analiză în sistemul de învățare a mașinilor este instructiv unic pentru a descoperi modul de modelare a comportamentului uman prin crearea de actori și agenți raționali. Acesta este doar un exemplu excelent al modului în care un echilibru poate fi utilizat pentru a face progrese în aplicarea sistemelor de învățare automată.

Cum poate informa conceptul de echilibru pentru proiectele de învățare automată?