arXivTimes icon indicating copy to clipboard operation
arXivTimes copied to clipboard

Offline Reinforcement Learning: Tutorial, Review, and Perspectives on Open Problems

Open icoxfog417 opened this issue 4 years ago • 1 comments

一言でいうと

収集済みのサンプルを利用するオフライン強化学習のチュートリアル資料。解説を始める前に、まずオフライン強化学習が有効に働くシチュエーションが述べられており学習のゴールがイメージできるようなっている(人間相手で多数の試行が困難な医療や対話が挙げられている)。

論文リンク

https://arxiv.org/abs/2005.01643

著者/所属機関

Sergey Levine, Aviral Kumar, George Tucker, Justin Fu

  • UC Berkeley
  • Google Research

投稿日付(yyyy/MM/dd)

2020/5/4

概要

新規性・差分

手法

結果

コメント

icoxfog417 avatar Feb 13 '21 03:02 icoxfog417

解説スライド https://speakerdeck.com/aiueola/offline-reinforcement-learning

icoxfog417 avatar Mar 24 '21 11:03 icoxfog417