学会玩捉迷藏的AI’比你想的更酷

9月17日,OpenAI发布了他们的 最新项目;可以玩捉迷藏的AI。通过玩几亿个捉迷藏游戏,两个相反的AI角色团队制定了复杂的策略。角色学会了使用工具和团队合作的经验,基本上他们是蹒跚学步的,并学会利用其创造者甚至不知道存在的环境中的漏洞。

人工智能 是使用一种称为强化学习的技术进行训练的,该技术在训练动物(和幼儿)的过程中起很大作用。为AI角色提供了表现行为的“奖励”。经过数百万场比赛,人工智能学会了最大化获胜的最佳方法。

在人工智能中’在捉迷藏游戏中,对立团队创造了一系列复杂的躲藏和寻求策略。上面的视频很好地说明了这一点。

研究人员设计了一个虚拟环境,其中包括一个封闭的空间以及各种物体(例如街区和坡道),以创建路障。对于那些简单的藏身者因避开寻找者而获得奖励的团队,而寻找者因找到藏身者而受到奖励的团队。还激励角色进行基于计数的探索。 人工智能 保持状态计数’来访者,并被鼓励去不常去的州。这些藏身箱是提前开始的,研究人员未提供进一步的指示。

“我们已经证明,代理商可以在高保真物理模拟器中学习复杂的工具使用;但是,在取得这一成果的过程中,我们吸取了很多教训。建立环境并非易事,代理商经常会在不希望的情况下找到利用您构建的环境或物理引擎的方法 way.”宣布这篇文章的博客帖子说。

在捉迷藏游戏中学会跳跳或冲浪的AI完全没有威胁。但是,许多人担心自我学习型AI表现出其他更险恶,看不见的行为的可能性。我认为AI就像阿拉丁的精灵一样,精灵虽然希望如此,但它们可能带来无法预料的后果。

分享是关怀!

1条评论

  1. 头像

    OMG的生产质量,叙述者,代理商’的面部表情,甚至图表也很可爱。这是科学论文还是在迪士尼开设了新的AI吸引力’s Epcot park! ?

评论已关闭,但 引用 和pingback是开放的。