
AI在游戏中实现的各种操作
Voyager被赋予的任务是完成游戏中存在的各种目标,包括了生存、战斗以及建造,并且随着游戏时间和经验的积累逐步提高自己的技能。
在实验中,Voyager并不能像人类一样正常地感知、操作游戏,而是通过API直接读取游戏的各种信息。假设在《我的世界》地图上存在一条小河和一根钓鱼竿,当Voyager识别到这两个信息后,GPT-4便会建议钓一些鱼来获得经验。

而当系统生成了这个目标后,GPT-4就会自动生成实现目标所需要的代码,以此让角色完成相应的动作。
这个项目最创新的部分在于是用GPT-4来生成驱使游戏人物行动的代码,而AI的实现逻辑和人类一样,第一次尝试某个任务时难免会失败,但它会收集错误信息和游戏反馈,根据状况调整代码并最终完成任务。
随着游戏时间变长,Voyager建立了一个自己的代码库,以便更快速地建造游戏里种类繁多的道具,这种行为也可以理解为AI正在累计自己的游戏经验。研究人员将Voyager的游戏进度与其他人工智能代理做对比,结果发现Voyager获得的物品数量是其他AI的三倍,探索的距离、建造物品的速度也远胜其他对照组。

相同时间下,Voyager是最先做出钻石剑的
之所以选择《我的世界》作为测试GPT-4的试验场,是因为这款游戏自由度高且没有过于明确的目标,AI如果想做到“玩得好”,那就需要进化出一些和人类玩家类似的能力,研究人员总结了几个关键技能。
比如“根据其当前的技能水平和世界状态提出适合的任务”——当身处沙漠时,AI会考虑先收集仙人掌而不是铁矿。再比如“根据环境反馈改进技能,并将掌握的技能保存在记忆中”——作为敌人,僵尸与蜘蛛类似,那么打僵尸总结的战斗经验就可以用在蜘蛛上。
当然,教AI玩游戏,最终试图实现的目标还是在游戏之外,研究人员表示通过这种方式训练语言模型,将来或许可以使许多日常办公任务自动化,或者根据使用者提出的需求来自动实现某些效果。
不过虽然前景美好,该项实验依旧还停留在初期阶段,想真正把让你头疼的工作交给AI,或许还要等待一段时间。
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体105114