Cuprins:
Definiție - Ce înseamnă Q-learning?
Învățarea Q este un termen pentru o structură de algoritm care reprezintă învățarea de armare fără model. Evaluând politica și folosind modelarea stocastică, învățarea Q găsește cea mai bună cale de urmat într-un proces de decizie Markov.
Techopedia explică Q-learning
Machiajul tehnic al algoritmului Q-learning implică un agent, un set de state și un set de acțiuni per stat.
Funcția Q folosește greutăți pentru diverse etape împreună cu un factor de reducere pentru a valorifica recompensele.
Deși poate părea o idee simplă, învățarea Q este extrem de importantă în multe tipuri de modele de învățare prin consolidare și învățare profundă. Unul dintre cele mai bune exemple este acela în care învățarea Q profundă este folosită pentru a ajuta programele de învățare automată pentru a învăța strategii de joc în diferite tipuri de jocuri video, de exemplu, în jocurile Atari din anii 1980. Aici, o rețea neuronală revoluționară prelevează mostre de joc pentru a elabora un model stocastic care va ajuta computerul să știe să joace jocul mai bine în timp.
Învățarea Q are un potențial abundent pentru a ajuta la promovarea inteligenței artificiale și a învățării automate.