标签：深度强化学习

深度强化学习专栏 —— 1.研究现状

自2013年DeepMind的论文Playing Atar……继续阅读 »

bug404 4年前 (2021-04-26) 2280浏览 0评论1279个赞

bug404 4年前 (2021-04-26) 1513浏览 0评论1935个赞

这是……继续阅读 »

bug404 4年前 (2021-04-26) 1539浏览 0评论1888个赞

目前训练强化学习智能体需要越来越多的数据和算力，分布式计算是加快训练过程的重要一环。Ray(RLlib)是由UC Berkeley’s RISE Lab在2017年发布，目前已经成为强化学习训……继续阅读 »

bug404 4年前 (2021-04-26) 2439浏览 0评论1896个赞

超参数的设置对强化学习算法的训练效果起着非常重要的作用，如果超参数没有调整好，可能非常好的网络结构和强化学习算法也发挥不出优势。超参数的调整是一项非常困难又略带玄学的工作，好在ray的tune能自动帮我们进行超参数的调整，找到最优的超参数。下面我们通过例子来看一下tune的使用……继续阅读 »

bug404 4年前 (2021-04-26) 2176浏览 0评论797个赞

ray的强大不仅在于他是分布式计算框架，更是因为有RLLib和tune的加持。tune的使用上一节我们已经讲了，这一节我们来看一下RLLib的使用。虽然后讲的rllib，但是真正训练的时候，还是tune使用的多，因为它调节超参数是很方便的，而rllib不具有自动调节超参数的能力。……继续阅读 »

bug404 4年前 (2021-04-26) 2388浏览 0评论495个赞

我们继续上一篇文章pybullet杂谈：使用深度学习拟合相机坐标系与世界坐标系坐标变换关系（一），在上一篇文章中，我们完成了物体世界坐标系和相机坐标系的坐标对应关系的数据，以及数据的存取……继续阅读 »

bug404 4年前 (2021-04-26) 2792浏览 0评论2897个赞

我们继续上一篇文章。上一篇已经完成了critic的设计，下面我们再来把actor完成。……继续阅读 »

bug404 4年前 (2021-04-26) 3152浏览 0评论448个赞