赞
踩
还记得 Devin 吗?这个由Cognition Labs开发的 世界上首位人工智能软件工程师 一经面世,其卓越的“工作能力”便促使人们开始谈论 工作替代 的问题。
在我们之前的一篇分析中,我们发现软件工程未来的趋势已经逐步以 管理AI编程代理 展开。
* 点击图片查看历史原文:《不久的将来,软件工程将主要围绕管理AI编程代理展开》
就在今天,Cosine推出了同类产品 Genie,并在权威测试平台SWE-Bench上以 30.08%的惊人评分,远超Devin(13.8%)和Swe-agent+GPT-4(12.47%)。
* 数据来源:https://cosine.sh/genie
* Genie技术报告原文:https://cosine.sh/blog/genie-technical-report
正如Genie官网上的slogan,Genie已经成为了 “全球最强的AI程序员”
那么Genie到底有多强大?让我们一起来看看吧!
* 视频来源:https://cosine.sh/genie
Genie取得高分是因为团队采用了全新的方法。为了使模型像软件工程师一样工作,模型必须理解人类软件工程师的工作方式。他们设计了全新技术,从实际工作案例中推导出人类的推理过程,数据代表了完美的信息传递、渐进的知识发现和逐步的决策过程,涵盖了人类工程师的所有逻辑。他们使用这个独特的数据集训练Genie,而不是简单地提示基础模型。结果显示,Genie不再只是随机生成代码,而是像人类一样解决问题。
简单来说,就是让Genie完全模仿人类的开发风格以及解决BUG、优化代码的习惯,然后自动完成任务。
功能方面,Genie主要支持:
- Feature Development(功能开发)
- Bug Fixing(BUG修复)
- Refactoring(代码重构)
- Minor Changes & Chores(代码小改动和杂项)
- Test Writing(代码测试)
- Writing and Updating Documentation(撰写和更新文档)
其在数据混合中的比例分别如下:
支持的编程语言包括JavaScript、 Python、Java、C#、C++、C、Rust、Scala、Kotlin、Swift、Golang、PHP和Ruby等几十种主流语言。
对于全球网友们对于Genie和Devin的先后排序问题,Alistair Pullen(Cosine的联合创始人&首席执行官)也在社媒上作出了回应,其实早在2022年12月他在英国伦敦大学的一次路演中便展示过当时版本的Genie。并告诉大家这是一个能像人类一样端到端自动执行、优化编码的AI机器人。
Alistair Pullen表示,现目前已经可以接受申请注册,未来的2至3周内测试权限将会正式发放。此外,发布时还会增加一些小惊喜功能。
目前,Genie已经开放试用申请,感兴趣的小伙伴可以前往申请体验。
申请地址:https://cosine.sh/register
- --- End ---
-
-
-
- 欢迎关注微软 智汇AI 官方账号
- 一手资讯抢先了解
-
- 喜欢就点击一下 在看 吧~
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。