Author/Authors :
Xi-Ren Cao، نويسنده , , Zhiyuan Ren، نويسنده , , Shalabh Bhatnagar، نويسنده , , Michael Fu، نويسنده , , Steven Marcus، نويسنده ,
Keywords :
Performance potentials , On-line optimization , Markov decision processes , Policy iteration , Time aggregation