DOPMC icon indicating copy to clipboard operation
DOPMC copied to clipboard

joyrl

Open johnjim0816 opened this issue 2 years ago • 13 comments

你是否已经阅读并同意《Datawhale开源项目行为准则》?

项目简介

该项目旨在开发一个强化学习的黑盒开源平台,并给读者呈现一个pip安装包的形式,让读者跳过复杂的强化算法和神经网络的设计,直接通过修改配置文件(yaml)来使用强化学习去解决相关任务。用户只需要对强化学习和深度学习有一个非常初步的认识就能够通过我们的平台解决相关问题。

立项理由

目前蘑菇书发行已经有一段时间,已经具有一定的读者基础,并深入了解了读者们更多的需求,也发现了更多的读者往往是非强化学习方向的交叉学科研究者,他们想将强化学习应用于各个领域,而苦于陷入强化学习算法设计的细节无法自拔。配合蘑菇书通俗讲解的一些概念,我们决定来开发这样一个平台帮助他们

项目受众

主要受众是想利用强化学习解决各类应用任务的交叉学科读者,其次是强化学习者

项目亮点

目前已有的项目主要有openai的spinninguprl和stable baselines,ray的RLlib以及清华的tianshou。 openai的spinninguprl目前的算法不是很全面,stable baselines虽然较为全面但是运行效率较低,对新手很不友好,且目前读者主要使用torch做人工智能相关的研究,stable baselines[torch]目前也比较残缺。RLlib弥补了在多线程并行方面的工作,但是仍然对新手或者交叉学科研究者不够友好,文档说明不够简单易用,且需要配置的东西有很多。 tianshou则有些华而不实的感觉。

项目规划

我们主要是实现各个算法以及补全一些常用的应用环境,主要工作内容如下:

  1. 以配置文件为基础的强化学习框架,即如何根据配置文件来设计网络
  2. 补全算法:包括单智能体强化学习、多智能体强化学习等等,我们旨在与时俱进,补全所有的流行算法
  3. pip安装包版本发行,目前还没有相关的经验
  4. 可视化编程平台(这个是比较超前的计划,可以面向诸如青少年等更多的受众,把我们的rl的easy发挥到极致!!!)

项目负责人

https://github.com/JohnJim0816 https://github.com/qiwang067 https://github.com/yyysjz1997

备注:发起立项申请后DOPMC将会在 72h 之内给出答复,如超时未答复请添加DOPMC负责人微信(微信号:at-Sm1les)问询~

  • [ ] 我已知悉上述备注

johnjim0816 avatar Sep 28 '22 03:09 johnjim0816

同意

finlay-liu avatar Sep 28 '22 06:09 finlay-liu

同意

qiwang067 avatar Sep 28 '22 06:09 qiwang067

可以给个简单的任务展示吗 : ) (同意

ZhikangNiu avatar Sep 29 '22 10:09 ZhikangNiu

同意

mba1398 avatar Sep 29 '22 14:09 mba1398

可以给个简单的任务展示吗 : ) (同意

目前蘑菇书代码已经包含一些基础,最近在写配置文件框架

johnjim0816 avatar Sep 30 '22 06:09 johnjim0816

同意

zhanhao93 avatar Oct 01 '22 07:10 zhanhao93

同意

ruyiluo avatar Oct 08 '22 02:10 ruyiluo

同意

zhanhao93 avatar Oct 09 '22 06:10 zhanhao93

同意

skywateryang avatar Oct 09 '22 13:10 skywateryang

同意 建议以项目规划的第一和第二目标完成为主。 第三部分我们好像还没有成功的产品,期待可以大获成功。 第四部分可以先不作为立项内容,与目前主计划距离较远。该规划可以在完成其他目标后再单独立项

andongBlue avatar Oct 09 '22 14:10 andongBlue

同意

GYHHAHA avatar Oct 09 '22 15:10 GYHHAHA

同意 建议以项目规划的第一和第二目标完成为主。 第三部分我们好像还没有成功的产品,期待可以大获成功。 第四部分可以先不作为立项内容,与目前主计划距离较远。该规划可以在完成其他目标后再单独立项

目前我们的想法也正如此

johnjim0816 avatar Oct 10 '22 08:10 johnjim0816

同意

Sm1les avatar Oct 12 '22 15:10 Sm1les