Swain
Swain
这是第二讲作业的示例提交 PR,请大家按照类似的文件组织结构和命名格式提交,有问题可以在该 PR 下留言 or 在微信群反馈
本 issue 将会追踪和记录各种有关课程第四讲的问题和思考,欢迎有兴趣的同学在这个 issue 中评论,课程组会定期整理信息。 最新的 [第四讲 QA 合集文档](https://github.com/opendilab/PPOxFamily/blob/main/chapter4_reward/chapter4_qa.pdf)(2023.05.24更新)
在本 issue 中,我们会更新所有和课程第三讲相关的应用 demo 素材及训练日志(持续更新中) - 软体机器人(向量观察空间) https://user-images.githubusercontent.com/33195032/212240553-18aff615-3587-4211-b183-6eac00f94904.mp4 - 超级马里奥(图片观察空间) Level 1-1 https://user-images.githubusercontent.com/33195032/212241811-e5232c11-8287-4816-b2a7-826860c27fbc.mp4 Level 1-4 https://user-images.githubusercontent.com/33195032/212241787-d12738a5-79aa-41b1-9cc1-8a59866249ee.mp4 - 羊了个羊(复杂结构化观察空间) https://user-images.githubusercontent.com/33195032/212259912-ebe5b1a8-3de7-44b1-a643-03ed5de628e5.mp4 - 大鱼吃小鱼(通用训练方法) https://user-images.githubusercontent.com/33195032/212259521-e10a8a11-49fb-4288-bce2-09b653211a2c.mp4
本 issue 将会追踪和记录各种有关课程第三讲的问题和思考,欢迎有兴趣的同学在这个 issue 中评论,课程组会定期整理信息。 最新的 [第三讲 QA 合集文档](https://github.com/opendilab/PPOxFamily/blob/main/chapter3_obs/chapter3_qa.pdf)(2023.02.20更新)
本 issue 将会追踪和记录各种有关课程第五讲的问题和延伸思考,欢迎有兴趣的同学在这个 issue 中评论,课程组会定期整理信息。 最新的 [第五讲 QA 合集文档](https://github.com/opendilab/PPOxFamily/blob/main/chapter5_time/chapter5_qa.pdf)(2023.05.05更新)
本 issue 将会追踪和记录各种有关课程第六讲的问题和延伸思考,欢迎有兴趣的同学在这个 issue 中评论,课程组会定期整理信息。 最新的 [第六讲 QA 合集文档](https://github.com/opendilab/PPOxFamily/blob/main/chapter6_marl/chapter6_qa.pdf)(2023.05.31更新)
本 issue 将会追踪和记录各种有关课程第一讲的问题和延伸思考,欢迎有兴趣的同学在这个 issue 中评论,课程组会定期整理信息 最新的 [QA 合集文档](https://github.com/opendilab/PPOxFamily/blob/main/chapter1_overview/chapter1_qa.pdf)(2022.12.22更新)
在本 issue 中,我们会更新所有和课程第六讲相关的应用 demo 素材及训练日志(持续更新中) - Multi Particle Environment (MPE) 多智能体协作入门环境 [中文参考文档](https://di-engine-docs.readthedocs.io/zh_CN/latest/13_envs/pettingzoo_zh.html) https://user-images.githubusercontent.com/33195032/230714411-3a026bfc-9956-4edb-88eb-4c8c2db142da.mp4 - SMAC 《星际争霸2》微观操作多智能体协作环境 [中文参考文档](https://di-engine-docs.readthedocs.io/zh_CN/latest/13_envs/smac_zh.html) https://user-images.githubusercontent.com/33195032/230714130-dcdfa630-bb3c-486f-b5a0-075577acf055.mp4 - GFootball 谷歌足球多智能体协作环境 [中文参考文档](https://di-engine-docs.readthedocs.io/zh_CN/latest/13_envs/gfootball_zh.html) https://user-images.githubusercontent.com/33195032/125933646-e24df3ec-9ec3-41d7-a693-136331f6a27a.mp4 - Multi-Agent MuJoCo 多智能体机器人控制协作环境 (TBD)
在本 issue 中,我们会更新所有和课程第五讲相关的应用 demo 素材及训练日志(持续更新中) - Pong(叠帧)[中文参考文档](https://di-engine-docs.readthedocs.io/zh_CN/latest/13_envs/atari_zh.html) https://user-images.githubusercontent.com/33195032/226870639-a8f5246b-8210-44c9-93a6-2520efbde52b.mp4 - Memory Len(LSTM/GTrXL)[中文参考文档](https://di-engine-docs.readthedocs.io/zh_CN/latest/13_envs/bsuite_zh.html) 