• 欢迎访问开心洋葱网站,在线教程,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站,欢迎加入开心洋葱 QQ群
  • 为方便开心洋葱网用户,开心洋葱官网已经开启复制功能!
  • 欢迎访问开心洋葱网站,手机也能访问哦~欢迎加入开心洋葱多维思维学习平台 QQ群
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏开心洋葱吧~~~~~~~~~~~~~!
  • 由于近期流量激增,小站的ECS没能经的起亲们的访问,本站依然没有盈利,如果各位看如果觉着文字不错,还请看官给小站打个赏~~~~~~~~~~~~~!

bug404的文章

人工智能

Ubuntu助手 — 一键自动安装软件,一键进行系统配置

Ubuntu助手 — 一键自动安装软件,一键进行系统配置
对于做ROS或者机器学习、深度学习的小伙伴,(重)装Ubuntu系统已经轻车熟路了吧。不经意间,升级内核导致显驱失效无法开机、ROS不小心搞坏,修复不如重装、或者首次安装系统等困扰,Ubuntu应用商店不好用、挨个装软件又很麻烦、有些软件还要搜索一下安装方式等等苦恼,都交给【Ub……继续阅读 »

3年前 (2021-04-26) 1200浏览 0评论2712个赞

人工智能

深度强化学习专栏 —— 5. 使用ray的tune组件优化强化学习算法的超参数

深度强化学习专栏 —— 5. 使用ray的tune组件优化强化学习算法的超参数
超参数的设置对强化学习算法的训练效果起着非常重要的作用,如果超参数没有调整好,可能非常好的网络结构和强化学习算法也发挥不出优势。超参数的调整是一项非常困难又略带玄学的工作,好在ray的tune能自动帮我们进行超参数的调整,找到最优的超参数。 下面我们通过例子来看一下tune的使用……继续阅读 »

3年前 (2021-04-26) 2329浏览 0评论2553个赞

人工智能

深度强化学习专栏 —— 6. 使用RLLib和ray进行强化学习训练

深度强化学习专栏 —— 6. 使用RLLib和ray进行强化学习训练
ray的强大不仅在于他是分布式计算框架,更是因为有RLLib和tune的加持。tune的使用上一节我们已经讲了,这一节我们来看一下RLLib的使用。虽然后讲的rllib,但是真正训练的时候,还是tune使用的多,因为它调节超参数是很方便的,而rllib不具有自动调节超参数的能力。……继续阅读 »

3年前 (2021-04-26) 2844浏览 0评论2236个赞

人工智能

深度强化学习专栏 —— 9. 实现机械臂reach某点之PPO算法实现(三)

深度强化学习专栏 —— 9. 实现机械臂reach某点之PPO算法实现(三)
前面两节讲完了critic、actor以及缓冲区的设计,下面就到了actor和critic的损失函数的环节了。对于神经网络来说,最重要的就是计算损失函数进行反向传播更新参数了。在计算损失函数之前,需要有batch的数据,所以上一节也把缓冲区的设计完成。这节完成损失函数的设计……继续阅读 »

3年前 (2021-04-26) 2033浏览 0评论737个赞

加载中……