Cuprins:
- Definiție - Ce înseamnă procesul de decizie Markov (MDP)?
- Techopedia explică procesul de decizie Markov (MDP)
Definiție - Ce înseamnă procesul de decizie Markov (MDP)?
Un proces de decizie Markov (MDP) este un lucru pe care profesioniștii îl numesc „un proces discret de control stococistic în timp”. Se bazează pe matematica pionieră de academicianul rus Andrey Markov la sfârșitul secolului XIX și începutul secolului XX.
Techopedia explică procesul de decizie Markov (MDP)
O modalitate de a explica un proces de decizie Markov și lanțurile Markov asociate este faptul că acestea sunt elemente ale teoriei jocurilor moderne, bazate pe cercetări matematice mai simple de către omul de știință rus în urmă cu câteva sute de ani. Descrierea unui proces de decizie Markov este că studiază un scenariu în care un sistem se află într-un anumit set de state și se îndreaptă către un alt stat bazat pe deciziile unui factor de decizie.
Un lanț Markov ca model arată o secvență de evenimente în care probabilitatea unui anumit eveniment depinde de o stare atinsă anterior. Profesioniștii pot vorbi despre un „spațiu de stat contabil” în descrierea procesului de decizie Markov - unii asociază ideea modelului de decizie Markov cu un model „mers la întâmplare” sau cu un alt model stochastic bazat pe probabilități (modelul de mers aleatoriu, adesea citat pe perete Street, modelează mișcarea unei acțiuni în sus sau în jos într-un context de probabilitate a pieței).
În general, procesele de decizie Markov sunt adesea aplicate la unele dintre cele mai sofisticate tehnologii la care profesioniștii lucrează astăzi, de exemplu, în robotică, automatizare și modele de cercetare.
