Global Convergence of Policy Gradient in Average Reward MDPs

Navdeep Kumar, Yashaswini Murthy, Itai Shufaro, Kfir Yehuda Levy, R. Srikant, Shie Mannor

May 2025 Machine Learning

Type

Conference paper

Publication

ICLR 2025

Reinforcement Learning Theory