自2013年DeepMind的论文Playing Atar……继续阅读 » bug404 4年前 (2021-04-26) 2586浏览 0评论570个赞
……继续阅读 » bug404 4年前 (2021-04-26) 3016浏览 0评论425个赞
这是……继续阅读 » bug404 4年前 (2021-04-26) 1509浏览 0评论654个赞
目前训练强化学习智能体需要越来越多的数据和算力,分布式计算是加快训练过程的重要一环。Ray(RLlib)是由UC Berkeley’s RISE Lab在2017年发布,目前已经成为强化学习训……继续阅读 » bug404 4年前 (2021-04-26) 1409浏览 0评论530个赞
超参数的设置对强化学习算法的训练效果起着非常重要的作用,如果超参数没有调整好,可能非常好的网络结构和强化学习算法也发挥不出优势。超参数的调整是一项非常困难又略带玄学的工作,好在ray的tune能自动帮我们进行超参数的调整,找到最优的超参数。 下面我们通过例子来看一下tune的使用……继续阅读 » bug404 4年前 (2021-04-26) 1963浏览 0评论1361个赞
ray的强大不仅在于他是分布式计算框架,更是因为有RLLib和tune的加持。tune的使用上一节我们已经讲了,这一节我们来看一下RLLib的使用。虽然后讲的rllib,但是真正训练的时候,还是tune使用的多,因为它调节超参数是很方便的,而rllib不具有自动调节超参数的能力。……继续阅读 » bug404 4年前 (2021-04-26) 1879浏览 0评论400个赞
我们继续上一篇文章pybullet杂谈 :使用深度学习拟合相机坐标系与世界坐标系坐标变换关系(一),在上一篇文章中,我们完成了物体世界坐标系和相机坐标系的坐标对应关系的数据,以及数据的存取……继续阅读 » bug404 4年前 (2021-04-26) 2728浏览 0评论2830个赞
我们继续上一篇文章。上一篇已经完成了critic的设计,下面我们再来把actor完成。……继续阅读 » bug404 4年前 (2021-04-26) 1355浏览 0评论171个赞