当前位置:   article > 正文

Hi Devin,I'm Genie!

Hi Devin,I'm Genie!

938928b0dd86668c5f110ee7d3ef3fbb.png

还记得 Devin 吗?这个由Cognition Labs开发的 世界上首位人工智能软件工程师 一经面世,其卓越的“工作能力”便促使人们开始谈论 工作替代 的问题。

6d8065787d13a619ddc83a86429880f6.png

在我们之前的一篇分析中,我们发现软件工程未来的趋势已经逐步以 管理AI编程代理 展开。

4c5b5986cf55778bf139093dc19c40b8.jpeg

* 点击图片查看历史原文:《不久的将来,软件工程将主要围绕管理AI编程代理展开》

就在今天,Cosine推出了同类产品 Genie,并在权威测试平台SWE-Bench上以 30.08%的惊人评分,远超Devin(13.8%)和Swe-agent+GPT-4(12.47%)。

120c38e08e4e34b5b3a4634b97af9165.png

* 数据来源:https://cosine.sh/genie

* Genie技术报告原文:https://cosine.sh/blog/genie-technical-report

7315f0e176e1bdbfdafc739ba3a398c4.png

正如Genie官网上的slogan,Genie已经成为了 “全球最强的AI程序员”

375b32336f0670ff6653a40f360d5cf9.png

那么Genie到底有多强大?让我们一起来看看吧!

* 视频来源:https://cosine.sh/genie

Genie取得高分是因为团队采用了全新的方法。为了使模型像软件工程师一样工作,模型必须理解人类软件工程师的工作方式。他们设计了全新技术,从实际工作案例中推导出人类的推理过程,数据代表了完美的信息传递、渐进的知识发现和逐步的决策过程,涵盖了人类工程师的所有逻辑。他们使用这个独特的数据集训练Genie,而不是简单地提示基础模型。结果显示,Genie不再只是随机生成代码,而是像人类一样解决问题。

简单来说,就是让Genie完全模仿人类的开发风格以及解决BUG、优化代码的习惯,然后自动完成任务。

功能方面,Genie主要支持:

- Feature Development(功能开发)

- Bug Fixing(BUG修复)

- Refactoring(代码重构)

- Minor Changes & Chores(代码小改动和杂项)

- Test Writing(代码测试)

- Writing and Updating Documentation(撰写和更新文档)

其在数据混合中的比例分别如下:

3a28a8200a133a8a3829c230ec7d7a06.png

支持的编程语言包括JavaScript、 Python、Java、C#、C++、C、Rust、Scala、Kotlin、Swift、Golang、PHP和Ruby等几十种主流语言。

bd30e485b08c7fbdcc2e34e1f944f05b.png

对于全球网友们对于Genie和Devin的先后排序问题,Alistair Pullen(Cosine的联合创始人&首席执行官)也在社媒上作出了回应,其实早在2022年12月他在英国伦敦大学的一次路演中便展示过当时版本的Genie。并告诉大家这是一个能像人类一样端到端自动执行、优化编码的AI机器人。

862b5340cf0f73c26350896e1e09b08e.png

Alistair Pullen表示,现目前已经可以接受申请注册,未来的2至3周内测试权限将会正式发放。此外,发布时还会增加一些小惊喜功能。

目前,Genie已经开放试用申请,感兴趣的小伙伴可以前往申请体验。

申请地址:https://cosine.sh/register

  1. --- End ---
  2. 欢迎关注微软 智汇AI 官方账号
  3. 一手资讯抢先了解
  4. 喜欢就点击一下 在看 吧~
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/笔触狂放9/article/detail/1010227
推荐阅读
  

闽ICP备14008679号