Progress: Reinforcement Learning¶
Collected by Jianan. 本章节会收录关于强化学习的参考材料,和Frontier的区别在于本章节将侧重和个人的学习研究有关的材料。部分文字从原文直接引用,如有侵权,立即删除。本文仅供个人参考学习,不作商业用途。
-
DeepMind 多智能体学习231页PPT总结 公众号
-
【高级强化学习课程+项目】Advanced Topics in Deep Reinforcement learning 公众号
-
本课程重点介绍深度强化学习近年来的最新研究进展,涉及强化学习中探索策略,模仿和反向强化学习,分层强化学习,强化学习中的进化策略,分布式强化学习,强化学习组合优化,多智能体强化学习,大规模强化学习,多任务和迁移强化学习,强化学习中的记忆机制
-
课程主页:https://deeppavlov.ai/rl_course_2020
Bilibili: https://www.bilibili.com/video/av668428103/
Youtube:https://www.youtube.com/playlist?list=PLt1IfGj6-_-eXjZDFBfnAhAJmCyX227ir
-
-
DRL Github大汇总 https://github.com/NeuronDance/DeepRL
- 本仓库由“深度强化学习实验室(DeepRL-Lab)”创建
-
强化学习路线图1 知乎
-
从Paper到Coding, 一览深度强化学习挑战34类游戏【论文及代码实现汇总】(Atari/Starcraft II等)
-
DeepMind-102页深度强化学习PPT(2019最新)-原理及部分代码实现 本slide是Namdo de Freitas教授在KHIPU上做强化学习报告的slide, 他于2017年加入DeepMind工作,本文主要涉及了策略梯度、分布式强化学习、PPO、强化学习应用以及Batch强化学习等。
-
深度强化学习的加速方法 深度强化学习大神Pieter Abbeel最近发表了深度强化学习的加速方法,他从整体上提出了一个加速深度强化学习周转时间的方法,成功的解决了一些问题,Pieter Abbeel,伯克利大学教授,也是强化学习的重要科学家之一。2019.1
-
深度强化学习十大原则 深度强化学习是最接近于通用人工智能(AGI)的范式之一。不幸的是,它目前还不能真正地奏效。实际上这并不是任何人的错,它更像是一个系统问题。讲述积极结果的故事是很容易的,但实现起来很难的,所以需要某些思想或者原则进行指导,本文将列举AlphaGo代表人David Sliver关于强化学习提出的十大原则。
-
DRL在Unity自行车环境中配置与实践 本文讲述则用深度强化学算法(DRL)在unity环境中制作完全基于物理引擎的无人驾驶自行车学习以及相关流程。文章主要面向研究强化学习的人,而不是unity开发者。因此无人驾驶自行车的环境会贴出gym环境的形式而不是unity工程的形式供大家把玩。
-
DeepRacer" ——顶级深度强化学习挑战赛 AWS DeepRacer 是一款 1:18 赛车,它提供了一种用强化学习 (RL) 解决自动驾驶技术的平台。有了 AWS DeepRacer,现在可通过自动驾驶亲身体验 RL、实验和学习。通过基于云的 3D 赛车模拟器开始使用虚拟汽车和赛道,并获得真实体验,可以将训练有素的模型部署到 AWS DeepRacer 中与好友比赛,或参与全球 AWS DeepRacer 联盟。
-