在电子游戏《gt赛车》(Gran Turismo)中,你可能会发现一辆轻型巡洋舰(Corvette)在你身后试图追赶你的滑流。
利用对手赛车的气流来加速并超越他们的技术是PlayStation现实赛车游戏的熟练玩家所青睐的。
但是这个克尔维特司机并不是由人类控制的——它是GT索菲,一个强大的人工智能代理,由playstation制造商索尼制造。
《gt赛车》自上世纪90年代推出以来,玩家们一直在与电脑生成的赛车比赛,但上周在《gt赛车7》上发布的新AI驾驶员更聪明、更快,因为它使用了最新的AI方法进行训练。
索尼AI首席运营官迈克尔·斯普兰杰(Michael Spranger)表示:“《gt赛车》在游戏一开始就内置了人工智能,但它的性能范围非常窄,而且不太好。”“这是可以预测的。一旦你超过了一定的水平,它就不会再吸引你了。”
但现在,他说,“这个人工智能将发起一场战斗。”
参观大学的人工智能实验室和索尼、谷歌、meta、微软和chatgtp制造商OpenAI等公司,你会发现像Sophy这样的人工智能代理赛车、向猪投掷愤怒的小鸟、进行史诗般的星际大战或帮助人类玩家建立新的Minecraft世界——这些都是计算机系统试图学习如何在游戏中变得更聪明的工作描述的一部分。
但在某些情况下,他们也在努力学习如何在现实世界中变得更聪明。在1月份的一篇论文中,剑桥大学(University of Cambridge)的一名研究人员构建了一个人工智能代理来控制Pokémon字符,他认为它可以“激发各种需要在极端不确定条件下进行团队管理的应用程序,包括在不断变化的环境中管理一个由医生、机器人或员工组成的团队,比如在大流行地区或战区。”
虽然这听起来像是一个孩子在玩三个小时的Pokémon Violet,但自20世纪中期以来,对游戏的研究已经被用于推进人工智能研究,并训练计算机解决复杂问题。
最初,人工智能被用于跳棋和国际象棋等游戏,以测试在战略游戏中获胜。现在,一个新的研究分支更专注于在复杂世界中执行开放式任务,并与人类互动,而不仅仅是为了击败他们。
“现实就像一场超级复杂的游戏,”Pokémon论文的作者尼古拉斯·萨伦蒂诺斯(Nicholas Sarantinos)说。他最近拒绝了牛津大学(Oxford University)的博士学位邀请,创办了一家人工智能公司,旨在帮助企业工作场所建立更具协作性的团队。
在基于网络的Pokémon摊牌战斗模拟器中,萨兰蒂诺斯开发了一种算法来分析一个由6人组成的Pokémon团队——根据他们面前所有可能的战斗场景以及他们的相对优势和劣势来预测他们将如何表现。
拥有广受欢迎的《我的世界》游戏特许经营权以及Xbox游戏系统的微软,给人工智能代理分配了各种活动——从避开熔岩到砍树和制造炉子。研究人员希望他们学到的一些知识最终能在现实世界的技术中发挥作用,比如如何让家用机器人在不需要编程的情况下承担某些家务。
Sarantinos说,虽然“不用说”现实中的人类与虚拟的电子游戏生物有很大的不同,但“核心思想仍然可以使用。”“如果你使用心理测试,你可以利用这些信息来得出结论,他们可以在多大程度上合作。”
Amy Hoover是新泽西理工学院(New Jersey Institute of Technology)的信息学助理教授,曾为数字纸牌游戏《炉石传说》(Hearthstone)构建算法。她表示,“研究游戏确实是有原因的”,但解释起来并不总是那么容易。
她说:“人们并不总是明白重点在于优化方法而不是游戏本身。
游戏还为人工智能提供了一个有用的测试平台——包括机器人或医疗保健方面的一些现实应用——在虚拟世界中尝试更安全,丹麦初创公司modell的研究人员兼联合创始人Vanessa Volz说。ai,为游戏开发构建ai系统。
但是,她补充说,“它可能被过度炒作了。”
“这可能不会是一个重大突破,一切都将转移到现实世界,”Volz说。
日本电子巨头索尼在2020年成立了自己的人工智能研究部门,目的是为了娱乐,但它还是吸引了更广泛的学术关注。去年,该公司介绍索菲亚的研究论文登上了著名科学杂志《自然》(Nature)的封面。该杂志称,索菲亚可能会对无人机和自动驾驶汽车等其他应用产生影响。
Sophy背后的技术是基于一种被称为强化学习的算法方法,当系统运行数千次虚拟比赛时,当它做对了一些事情时,就会奖励它,从而对系统进行训练。
“奖励会告诉你,‘你正在进步。’或者,‘你跑题了。嗯,这可不太好,’”Spranger说。
世界上最好的《gt赛车》玩家在比赛中仍然领先于Sophy,但普通玩家会发现它很难被击败,并且可以根据他们想要挑战的程度来调整难度设置。
PlayStation玩家只能在3月31日之前在有限的赛道上尝试与Sophy比赛,所以它可以得到一些反馈并重新进行测试。索尼美国人工智能总监、《GT Sophy》项目负责人彼得·沃曼表示,人工智能特工在20台游戏机上训练大约需要两周时间。
他说:“要让它在整个游戏中传播开来,在我们准备好之前,还需要更多的突破和时间。”
把它开上真正的街道或f1赛道?这可能需要更长的时间。
自动驾驶汽车公司采用了类似的机器学习技术,但“他们不会像我们这样完全交出对汽车的控制权,”沃曼说。“在一个模拟的世界里,没有人的生命受到威胁。你确切地知道你会在环境中看到什么。没有人过马路或类似的事情。”