当前位置:   article > 正文

Voyager:「我的世界」中的 Agent

Voyager:「我的世界」中的 Agent

项目视频 https://voyager.minedojo.org/
论文地址 https://arxiv.org/abs/2305.16291
代码地址:https://github.com/MineDojo/Voyager
作者推特;https://twitter.com/drjimfan/status/1662115266933972993?s=46&t=F6BXooLyAyfvHbvr7Vw2-g

如果我们在 Minecraft 中免费设置 GPT-4 会怎样?

我很高兴地宣布 Voyager,这是第一个完全在上下文中玩 Minecraft 的终身学习代理。 Voyager 通过编写、提炼、提交和从技能库中检索代码不断改进自己。

GPT-4 解锁了一种新范式:“训练”是代码执行而不是梯度下降。 “训练有素的模型”是 Voyager 迭代组合的技能代码库,而不是浮点数矩阵。我们正在将无梯度架构推向极限。

Voyager 迅速成为经验丰富的探险家。在 Minecraft 中,它获得的独特物品增加了 3.3 倍,行进距离增加了 2.3 倍,解锁关键科技树里程碑的速度比之前的方法快了 15.3 倍。

我们开源一切。让通才特工出现在 Minecraft 中!欢迎大家今天来试试

RT宝玉
这是继斯坦福的25人小镇后我看到的最有意思的AI论文了。

简单来说,Jim Fan的团队做了一个类似于AutoGPT的AI代理叫Voyager,但这个代理主要是用来玩Minecraft的,给Voyager提供一个操作Minecraft的JS库,并且接入GPT-4,这期间不需要人类干预,完全有GPT-4自主根据游戏的反馈进行推理,决定下一步的任务,根据任务需要去组合或者写新的代码来推动游戏任务。

最终随着代码库的完善,Voyager能轻松在Minecraft中完成复杂的任务,取得很好的成绩。

从技术实现上来说,Voyager由3个关键的部分组成:

  1. 代码生成器:根据游戏反馈、运行结果来优化和生成操作游戏的代码;

Voyager使用的是一个流行的Javascript Minecraft 操作库 (Mineflayer),GPT-4可以根据任务需要生成游戏操作代码,例如combatZombie。但在运行生成的代码后可能会遇到错误,通常有两种错误,一种是JavaScript的执行错误,比如语法错误;一种是游戏反馈的错误,比如在制作木棒之前需要再有2块木板。GPT-4可以根据错误信息对生成的代码进行优化,直到能正常执行为止。
在这里插入图片描述

Voyager通过自我驱动的探索不断发现新的《我的世界》物品和技能,大大优于基线。

  1. 代码技能库:存储生成的游戏操作代码,检索已经生成的游戏操作代码;

每次GPT-4生成并验证一个新技能的代码后,Voyager首先会将生成的代码用GPT-3.5(省钱

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家小花儿/article/detail/161812
推荐阅读
相关标签