arXivTimes
arXivTimes copied to clipboard
Offline Reinforcement Learning: Tutorial, Review, and Perspectives on Open Problems
一言でいうと
収集済みのサンプルを利用するオフライン強化学習のチュートリアル資料。解説を始める前に、まずオフライン強化学習が有効に働くシチュエーションが述べられており学習のゴールがイメージできるようなっている(人間相手で多数の試行が困難な医療や対話が挙げられている)。
論文リンク
https://arxiv.org/abs/2005.01643
著者/所属機関
Sergey Levine, Aviral Kumar, George Tucker, Justin Fu
- UC Berkeley
- Google Research
投稿日付(yyyy/MM/dd)
2020/5/4
概要
新規性・差分
手法
結果
コメント
解説スライド https://speakerdeck.com/aiueola/offline-reinforcement-learning