赞
踩
项目视频 https://voyager.minedojo.org/
论文地址 https://arxiv.org/abs/2305.16291
代码地址:https://github.com/MineDojo/Voyager
作者推特;https://twitter.com/drjimfan/status/1662115266933972993?s=46&t=F6BXooLyAyfvHbvr7Vw2-g
我很高兴地宣布 Voyager,这是第一个完全在上下文中玩 Minecraft 的终身学习代理。 Voyager 通过编写、提炼、提交和从技能库中检索代码不断改进自己。
GPT-4 解锁了一种新范式:“训练”是代码执行而不是梯度下降。 “训练有素的模型”是 Voyager 迭代组合的技能代码库,而不是浮点数矩阵。我们正在将无梯度架构推向极限。
Voyager 迅速成为经验丰富的探险家。在 Minecraft 中,它获得的独特物品增加了 3.3 倍,行进距离增加了 2.3 倍,解锁关键科技树里程碑的速度比之前的方法快了 15.3 倍。
我们开源一切。让通才特工出现在 Minecraft 中!欢迎大家今天来试试
RT宝玉
这是继斯坦福的25人小镇后我看到的最有意思的AI论文了。
简单来说,Jim Fan的团队做了一个类似于AutoGPT的AI代理叫Voyager,但这个代理主要是用来玩Minecraft的,给Voyager提供一个操作Minecraft的JS库,并且接入GPT-4,这期间不需要人类干预,完全有GPT-4自主根据游戏的反馈进行推理,决定下一步的任务,根据任务需要去组合或者写新的代码来推动游戏任务。
最终随着代码库的完善,Voyager能轻松在Minecraft中完成复杂的任务,取得很好的成绩。
从技术实现上来说,Voyager由3个关键的部分组成:
Voyager使用的是一个流行的Javascript Minecraft 操作库 (Mineflayer),GPT-4可以根据任务需要生成游戏操作代码,例如combatZombie。但在运行生成的代码后可能会遇到错误,通常有两种错误,一种是JavaScript的执行错误,比如语法错误;一种是游戏反馈的错误,比如在制作木棒之前需要再有2块木板。GPT-4可以根据错误信息对生成的代码进行优化,直到能正常执行为止。
Voyager通过自我驱动的探索不断发现新的《我的世界》物品和技能,大大优于基线。
每次GPT-4生成并验证一个新技能的代码后,Voyager首先会将生成的代码用GPT-3.5(省钱
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。