当前位置:   article > 正文

大模型日报2024-04-07

大模型日报2024-04-07

大模型日报

2024-04-07

大模型资讯

  1. EURUS:针对推理优化的大型语言模型套件,取得开源模型多项基准测试的最先进成果

  • 摘要: EURUS是一套针对推理能力进行优化的大型语言模型(LLMs),在多项多样化的基准测试中取得了最先进的结果。这些测试结果显示EURUS在开源模型中表现卓越,标志着在自然语言处理领域的一个重要进步。

  1. 阿里巴巴发布全新多语言Qwen1.5 32B模型,超越Mixtral排名首位

  • 摘要: 阿里巴巴的AI研究部门推出了Qwen语言模型系列的最新产品——Qwen1.5-32B。这款新型多语言密集型大型语言模型(LLM)具有32000个上下文限制,并在开放语言模型排行榜上超越了Mixtral,表现出卓越的性能。

  1. 发布Poro 34B:多语言AI模型,训练覆盖1万亿词汇

  • 摘要: Poro 34B是一个34B参数的人工智能模型,专门针对芬兰语、英语以及编程语言进行训练,共处理了1万亿词汇。其中包括了80亿个芬兰语-英语翻译对。这种先进的语言模型的预训练需要大量的文本数据,通常达到数万亿词的规模。

  1. 大型语言模型增强的CO2还原电催化剂及合成程序数据集

  • 摘要: 《科学数据》杂志报道,CO2电还原技术因其在学术和工业界的重要性而受到广泛关注。为了推动该领域研究,已开发了一个包含CO2还原电催化剂及其合成方法的增强型语料库,该语料库由大型语言模型加强,旨在提取关键信息,加速材料发现和合成过程的优化。

  1. 人工智能模型解码mRNA以改进疫苗

  • 摘要: 近期,一种在编写软件和通过律师资格考试中引起热议的人工智能模型展现了新的能力:阅读基因组。该模型成功解码了信使RNA(mRNA),这一进展可能有助于改进疫苗设计。这标志着人工智能在生物医学领域的又一重要应用。

  1. QuaRot实现大型语言模型的全4比特推理

  • 摘要: 近期,QuaRot技术能够将大型语言模型(LLMs)量化到4比特,提升了模型的效率和可部署性。目前已有多种方法实现这一量化过程,包括GPTQ、AWQ、SqueezeLLM、AQLM以及结合GGUF的llama.cpp等,这些方法均展现出卓越性能。

  1. SEI与OpenAI共同提出大型语言模型在网络安全应用中的评估方法

  • 摘要: 卡内基梅隆大学的软件工程研究所(SEI)与OpenAI联合发布了一份白皮书,提出了针对大型语言模型在网络安全领域应用的评估方法。该白皮书旨在为如何有效评估这些模型在预防网络攻击和威胁中的表现提供指导。

  1. 斯坦福大学研究人员推出Octopus v2:提升设备内语言模型以实现超级代理功能

  • 摘要: 斯坦福大学的研究人员开发了Octopus v2,这是一种新型的语言模型,旨在解决人工智能中的一个关键挑战,即如何在保持模型性能的同时实现大型语言模型(LLMs)的设备内运行。这一进展有望增强语言模型的功能,使其能够更好地作为智能代理在各种设备上运行,而不牺牲性能。

  1. Gretel发布全球最大开源文本至SQL数据集,助力企业释放AI潜能

  • 摘要: Gretel公司宣布发布了世界上最大的开源text-to-SQL数据集,旨在帮助企业更好地利用人工智能技术。该公司还将于4月10日在亚特兰大举办一场活动,探讨安全劳动力领域的现状。活动中将讨论人工智能的愿景、优势及其实际应用案例。

  1. Opera浏览器开发版新增本地运行大型语言模型(LLMs)与AI聊天机器人功能

  • 摘要: Opera浏览器最新的开发版本更新中,新增了一个特性,允许用户下载并在个人电脑上运行强大的大型语言模型(LLMs)。这一更新让用户能够本地访问和使用AI聊天机器人,进一步增强了Opera浏览器的功能性和用户体验。

大模型产品

大模型论文

大模型开源项目

  1. plandex-ai:复杂任务AI编程引擎

  • 摘要: plandex-ai是一个用Go语言编写的AI编程引擎,专为处理复杂的编程任务而设计,能够提高开发效率并解决高难度问题。

  1. nilsherzig:本地LLM搜索聚合器

  • 摘要: nilsherzig项目是一个完全本地运行的搜索聚合器,使用多个LLM代理来回答用户提问。整个搜索过程无需依赖OpenAI或Google的API,项目使用Go语言编写,用户可以实时查看代理的搜索进度及最终答案。

  1. FoundationVision:视觉自回归模型

  • 摘要: FoundationVision是一款基于官方实现的AI视觉生成项目,运用了GPT和扩散模型的优势,遵循可扩展的图像生成法则,通过下一尺度预测实现高效的视觉自回归建模。

  1. 普林斯顿NLP推出SWE-agent项目

  • 摘要: SWE-agent是普林斯顿NLP的AI项目,利用GPT-4等语言模型自动修复GitHub问题。在SWE-bench评测集上解决了12.29%的错误,运行时间仅需1.5分钟。项目采用Python语言编写。

以上就是2024-04-07的大模型日报,很高兴为你服务!

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/weixin_40725706/article/detail/480776
推荐阅读
相关标签
  

闽ICP备14008679号