مرکز منطقه ای اطلاع رساني علوم و فناوري - Loss bounds for uncertain transition probabilities in Markov decision processes

DocumentCode :

3173220

Title :

Loss bounds for uncertain transition probabilities in Markov decision processes

Author :

Mastin, Andrew ; Jaillet, Patrick

Author_Institution :

Dept. of Electr. Eng. & Comput. Sci., Massachusetts Inst. of Technol., Cambridge, MA, USA

fYear :

2012

fDate :

10-13 Dec. 2012

Firstpage :

6708

Lastpage :

6715

Abstract :

We analyze losses resulting from uncertain transition probabilities in Markov decision processes with bounded nonnegative rewards. We assume that policies are precomputed using exact dynamic programming with the estimated transition probabilities, but the system evolves according to different, true transition probabilities. Given a bound on the total variation error of estimated transition probability distributions, we derive upper bounds on the loss of expected total reward. The approach analyzes the growth of errors incurred by stepping backwards in time while precomputing value functions, which requires bounding a multilinear program. Loss bounds are given for the finite horizon undiscounted, finite horizon discounted, and infinite horizon discounted cases, and a tight example is shown.

Keywords :

Markov processes; dynamic programming; estimation theory; infinite horizon; linear programming; statistical distributions; uncertain systems; Markov decision process; bounded nonnegative reward; dynamic programming; error growth; estimated transition probability distribution; finite horizon undiscounted; infinite horizon discounted; loss bounds; multilinear program; total variation error; uncertain transition probabilities; value function; Approximation methods; Dynamic programming; Linear programming; Markov processes; Probability distribution; Upper bound; Vectors;

fLanguage :

English

Publisher :

ieee

Conference_Titel :

Decision and Control (CDC), 2012 IEEE 51st Annual Conference on

Conference_Location :

Maui, HI

ISSN :

0743-1546

Print_ISBN :

978-1-4673-2065-8

Electronic_ISBN :

0743-1546

Type :

conf

DOI :

10.1109/CDC.2012.6426504

Filename :

6426504

Link To Document :

https://search.ricest.ac.ir/dl/search/defaultta.aspx?DTC=49&DC=3173220