Publications

[ICML 2024] “Towards Global Optimality for Practical Average Reward Reinforcement Learning without Mixing Time Oracles”

Bhrij Patel, Wesley A. Suttle, Alec Koppel, Vaneet Aggarwal, Brain M. Sadler, Amrit Singh Bedi, Dinesh Manocha.

[ICML 2023] “Beyond Exponentially Fast Mixing in Average-Reward Reinforcement Learning via Multi-Level Monte Carlo Actor-Critic.”

Wesley A. Suttle, Amrit Singh Bedi, Bhrij Patel, Alec Koppel, Brain M. Sadler, Dinesh Manocha.

Caroline Wang, Bin Han, Bhrij Patel, Cynthia Rudin

Preprints

Bhrij Patel, Vishnu Sashank Dorbala, Dinesh Manocha, Amrit Singh Bedi.

Vishnu Sashank Dorbala,Bhrij Patel, Amrit Singh Bedi, Dinesh Manocha.

Bhrij Patel, Kasun Weerakoon, Wesley A. Suttle, Alec Koppel, Brian M. Sadler, Tianyi Zhou, Amrit Singh Bedi, Dinesh Manocha.