Rumah Pembangunan Apakah proses keputusan markov (mdp)? - definisi dari techopedia

Apakah proses keputusan markov (mdp)? - definisi dari techopedia

Isi kandungan:

Anonim

Definisi - Apa maksud Proses Keputusan Markov (MDP)?

Proses keputusan Markov (MDP) adalah sesuatu yang dirujuk sebagai profesional sebagai "proses kawalan stokastik masa diskret." Ia berdasarkan matematik yang dipelopori oleh akademik Rusia Andrey Markov pada akhir abad ke-19 dan awal abad ke-20.

Techopedia menerangkan Proses Keputusan Markov (MDP)

Salah satu cara untuk menerangkan proses keputusan Markov dan rantaian Markov yang berkaitan adalah bahawa ini adalah unsur-unsur teori permainan moden yang didasarkan pada penyelidikan matematik yang lebih mudah oleh saintis Rusia beberapa ratus tahun yang lalu. Penerangan tentang proses keputusan Markov adalah bahawa ia mengkaji senario di mana suatu sistem berada dalam beberapa set negeri tertentu, dan bergerak maju ke negara lain berdasarkan keputusan pembuat keputusan.

Rantai Markov sebagai model menunjukkan urutan kejadian di mana kebarangkalian peristiwa tertentu bergantung kepada keadaan yang telah dicapai sebelumnya. Profesional boleh bercakap tentang "ruang negeri yang dapat dikira" dalam menerangkan proses keputusan Markov - sesetengah mengaitkan idea model keputusan Markov dengan model "rawak berjalan" atau model stokastik lain berdasarkan kebarangkalian (model jalan rawak, yang sering disebut di Wall Jalan, model pergerakan ekuiti naik atau turun dalam konteks kebarangkalian pasaran).

Secara umum, proses keputusan Markov sering digunakan untuk beberapa teknologi yang paling canggih yang profesional bekerja pada hari ini, contohnya, dalam robotika, automasi dan model penyelidikan.

Apakah proses keputusan markov (mdp)? - definisi dari techopedia