DeepMind论文:调控运动控制器的学习和迁移
摘要:
针对运动型任务,我们研究了一种新型的架构和训练过程。这是一种具有本体感应的高频传感器和低级「脊椎(spinal)」结构的网络,它通过对简单任务的训练来学习感觉运动的原理(primitives)。它有固定的预训练模块,并连接到一个低频、高级的「大脑皮层」网络,这个网络连接了所有的传感器,通过调控传输到「脊柱」网络的信息来控制行为。在单个端到端的架构完全失败的场景下,我们使用预先训练的「脊柱」模块能在多个高级任务中取得成功,并且使得在稀疏奖励空间(sparse reward)中能够进行有效探索。我们在 3 个模拟物体上进行了测试:游泳的 16 维的蛇,20 维的四脚生物,以及 54 维的人。最后,我们将结果展示成视频显示在此网址 https://youtu.be/sboPYvhpraQ 中。
论文地址:Learning and Transfer of Modulated Locomotor Controllers
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 3561739510@qq.com 举报,一经查实,本站将立刻删除。
- 站长推荐
-
-
小米手机智能充电保护,让电池更持久(教你如何开启小米手机的智能充电保护功能)
-
手机移动数据网速慢的解决方法(如何提升手机移动数据网速)
-
如何解除苹果手机的运营商锁(简单教你解锁苹果手机)
-
电视信号源消失了,怎么办(应对电视信号源失联的常见问题和解决方法)
-
解决飞利浦咖啡机的常见故障(咖啡机故障排除指南)
-
四芯网线水晶头接法详解(四芯网线水晶头接法步骤图解与注意事项)
-
解决电脑打印机加了墨水后无法正常工作的问题(墨水添加后打印机故障的排除方法)
-
欧派壁挂炉常见故障及解决方法(为您解决欧派壁挂炉故障问题)
-
解决打印机用户干预问题的有效方法(提高打印机效率)
-
冰箱门不吸的原因及检修方法(探索冰箱门密封问题)
-
- 热门tag
- 标签列表
- 友情链接