当前位置:   article > 正文

大模型日报2024-04-02

大模型日报2024-04-02

大模型日报

 

2024-04-02

 

大模型资讯

 

  1. 斯坦福与Databricks合作开源BioMedLM:一个基于PubMed文本训练的27亿参数GPT模型

 

  • 摘要: 斯坦福大学和Databricks的研究人员共同开源了BioMedLM,这是一个具有27亿参数的GPT风格的人工智能语言模型。该模型专门针对PubMed的文本资料进行训练,标志着自然语言处理(NLP)技术在人工智能领域的又一重大进展。

 

  1. GPT-4有望减轻临床医生文档工作负担

 

  • 摘要: 最新研究评估了基于GPT-4的临床总结方法,结果表明这类大型语言模型可能有助于减轻临床医生的文档记录负担。通过自动化总结病历信息,GPT-4提高了工作效率,为医生节省了宝贵时间。

 

  1. 微软推出大规模AI集成:会计师需要知道的

 

  • 摘要: 微软最新推出的Copilot项目将生成性AI技术与关键应用程序结合起来,这可能会彻底改变会计师的工作方式。早期采用者的反馈表明,通过AI的加持,会计工作的效率和准确性将得到显著提升。

 

  1. Google DeepMind推出Fact Quest:通过SAFE提高LLMs的长篇准确性

 

  • 摘要: Google DeepMind最新研究项目Fact Quest旨在提升大型语言模型(LLMs)处理长篇内容的准确性。通过SAFE(一种新的改进机制)的应用,LLMs的性能得到显著提升,能够更加流畅地进行对话,生成创意文本等。

 

  1. DARPA致力于开发可信赖的AI自主性应用供战士使用

 

  • 摘要: 美国国防高级研究计划局(DARPA)正着手开发可供战士信赖的人工智能(AI)应用。这一目标对于提高战场上的决策质量和效率至关重要。DARPA的研究旨在确保AI系统的可靠性和安全性,以便在未来的军事操作中得到有效利用。

 

  1. 数据中心能耗激增 需推动能效解决方案

 

  • 摘要: 随着人工智能和大型语言模型的出现,计算能源消耗增加,数据中心的电力需求急剧上升。为应对这一挑战,亟需开发和采纳更有效的能源效率解决方案,以减少能源消耗并优化数据中心的能源使用效率。

 

  1. Box携手OpenAI将生成性AI工具整合到其平台

 

  • 摘要: Box正在与OpenAI合作,计划将生成性人工智能工具引入其企业平台。在过去六周内,包括一些成熟的企业软件公司在内,已有多家企业宣布了相关的生成性AI技术应用。这标志着企业级应用程序正逐渐融入先进的AI功能,以提升业务流程和用户体验。

 

  1. LUMOS:一个开源的通用语言代理训练框架

 

  • 摘要: LUMOS是一款新推出的开源训练框架,旨在培养数字助手,使其具备回答问题、浏览网页、解决复杂数学问题等能力。这标志着数字助手的功能正变得越来越全面,为用户提供更加智能化的帮助。

 

  1. LISA:一种基于概率随机冻结大型语言模型层的机器学习优化算法

 

  • 摘要: Layerwise Importance Sampled AdamW(LISA)是一种新型机器学习优化算法,它通过给定的概率随机冻结大型语言模型(LLM)的层。这种方法可用于创建文档、开发复杂代码、回答问题以及进行类似人类的对话等任务,旨在提高模型训练的效率和效果。

 

  1. NVIDIA AI研究提出LITA:利用视频LLMs进行精准时间定位

 

  • 摘要: NVIDIA的AI研究团队最新提出了一种名为LITA(Language Instructed Temporal-Localization Assistant)的技术,该技术能够通过大型语言模型(LLMs)实现对视频内容的精确时间定位。这表明,LLMs在遵循指令方面的能力十分出色,有潜力成为解决各种问题的通用界面。

 

大模型产品

 

  1. XilterAI:智能推特内容过滤

 

  • 摘要: XilterAI利用GPT-4人工智能技术,个性化定制你的Twitter/X时间线,自动屏蔽不想看到的推文,提升社交媒体体验。

 

  1. Salieri多元宇宙:AI故事创作

 

  • 摘要: Salieri’s Multiverse.ai是一款AI增强型沙盒工具,可将您的想法转化为互动且带插图的多角色冒险故事。用户可以轻松创作并分享引人入胜的叙述,结合创意与尖端技术。

 

  1. LeadGenSheet:AI领先生成工具

 

  • 摘要: LeadGenSheet是一款AI谷歌表格插件,帮助初创企业在谷歌表格中寻找潜在客户、联系方式、网页信息,并实现大规模邮件自动发送。它简化了潜在客户的生成、丰富、资格审查和邮件自动化流程。

 

  1. 圆圈搜索:拖动即知

 

  • 摘要: 圆圈搜索是一款浏览器扩展,允许用户通过圈选页面内容即刻获取信息。无需离开页面或复制粘贴,内嵌AI助手可提供深入洞察。

 

  1. OpenDevin:少码更高效

 

  • 摘要: OpenDevin旨在复制Devin——一位自主AI软件工程师。它能执行复杂的工程任务,与用户积极协作进行软件开发项目,旨在让编程工作更加高效简便。

 

  1. CodeRabbit: AI助力减半代码审查时间

 

  • 摘要: CodeRabbit是一款AI驱动的自动化代码审查工具。它支持实时协作,能根据用户反馈微调审查,并配备可配置规则引擎,旨在减少错误,加快代码部署,让开发者专注解决更大的问题。

 

  1. 营销超级AI提示:一键加速营销

 

  • 摘要: 「Mega-Prompts for Marketing」提供终身获取数百个精心设计的AI营销提示。这些提示能够帮助你自动化地加速营销任务,无论是启动、成长还是扩大你的业务,AI助力都将无所不在。

 

  1. moji AI表情穿戴:情感外包神器

 

  • 摘要: 累了吗?让微笑成为历史。moji AI表情穿戴设备帮你外包情感表达。只需举起moji,它就会监听并以适当的动画表情为你作出反应!

 

  1. Dodoboo:儿童友好AI绘画平台

 

  • 摘要: Dodoboo专为新一代儿童设计,是一个超酷、安全、刺激的AI绘画平台。它能将孩子们的画作变为令人惊叹的艺术品,激发他们的想象力和创造力。

 

  1. Uppply:AI职位搜索引擎

 

  • 摘要: Uppply利用尖端的大型语言模型(LLM)技术,为用户提供个性化的职位搜索服务。它能够简化发现、追踪和申请全球数千个职位的过程,让求职更加高效无忧。立即加入这场求职的未来浪潮!

 

大模型论文

 

  1. 长文本不确定性量化研究

 

  • 摘要: 本文提出了一种针对大型语言模型长文本生成的不确定性量化方法LUQ。LUQ通过采样技术提高模型输出的事实性,并通过LUQ-Ensemble方法结合多个模型的回答,显著提升了长文本回答的准确性。

 

  1. 评估大型视觉语言模型的新方法

 

  • 摘要: 本文指出当前评估大型视觉语言模型(LVLMs)存在问题,包括无需视觉内容即可回答问题和数据泄露。提出MMStar基准,通过人工精选样本,更准确评估LVLMs的多模态能力。

 

  1. ReALM:语言模型化的指代消解

 

  • 摘要: 本文提出了ReALM系统,利用大型语言模型(LLM)有效解决各类指代问题。通过将指代消解转化为语言建模问题,即使是非传统文本模态的实体,如用户屏幕上的实体,也能实现显著性能提升,超越现有系统,并与GPT-3.5及GPT-4相比具有竞争力。

 

  1. LayerNorm在参数高效微调中的关键作用

 

  • 摘要: 研究表明,在BERT等模型中,LayerNorm是微调最关键的部分。通过仅微调LayerNorm,可以在GLUE任务上达到与全面微调相当或更好的效果,同时显著降低计算成本。

 

  1. Gecko:高效文本嵌入模型

 

  • 摘要: Gecko是一种紧凑多用途文本嵌入模型。通过从大型语言模型中提炼知识,实现了高效的信息检索性能。Gecko使用两步蒸馏过程,首先生成多样化的合成配对数据,然后对数据进行进一步的精炼,以优化查询相关的候选段落。在MTEB上,256维的Gecko嵌入超过了768维的现有模型。

 

  1. 卷积提示与语言模型结合的持续学习

 

  • 摘要: 提出ConvPrompt,一种新型卷积提示机制,通过层间共享嵌入实现特定层学习和任务间概念迁移。利用大型语言模型生成细粒度文本描述,动态决定学习的提示数量,显著提升持续学习性能,减少参数开销。

 

  1. 通过否定提升视觉语言模型

 

  • 摘要: 本文介绍了通过加强否定概念理解来改善视觉语言模型的方法。提出了CC-Neg数据集与CoN-CLIP框架,显著提升了模型在零样本图像分类和复合性基准测试中的表现,同时降低了计算成本。

 

  1. 绿色大型语言模型的能效优化

 

  • 摘要: 本文探讨了以能效为主导的大型语言模型(LLMs)服务的权衡,分析了不同输入、模型和服务级别协议下的能效调节手段,旨在实现数据中心环境中LLMs的可持续与成本效益部署。

 

  1. LLMs在医疗决策中的应用研究

 

  • 摘要: 研究了大型语言模型(LLMs)如Meditron、Llama2和Mistral在医疗决策中的应用。发现提示设计对LLMs准确性有显著影响,LLMs能够提供有价值的反馈,纠正错误诊断。

 

  1. 绘画理解:视觉提示增强MLLMs

 

  • 摘要: 本文提出了Draw-and-Understand项目,引入了SPHINX-V模型,MDVP-Data多域数据集和MDVP-Bench基准,旨在通过视觉提示提升多模态大型语言模型的交互能力和理解深度。

 

大模型开源项目

 

  1. 微软开源生成式AI入门课程

 

  • 摘要: 微软发布了18课的生成式AI入门教程,旨在帮助初学者理解和应用生成式人工智能技术。教程包含丰富的案例,使用Jupyter Notebook编写,课程资料可通过提供的链接访问。

 

  1. 无监督语音编辑与野外文转语

 

  • 摘要: jasonppy项目实现了零样本学习的语音编辑与文本转语音功能。它使用Jupyter Notebook编写,可直接在野外环境中应用,无需预先训练数据。

 

  1. 开发者摘要:构建复杂度驱动答案引擎

 

  • 摘要: 该项目利用Next.js、Groq、Mixtral、Langchain、OpenAI、Brave和Serper技术,开发了一个基于困惑度概念的答案引擎。整个系统采用TypeScript编写,旨在提供高效、智能的问题解答服务。

 

  1. AniPortrait: 真实肖像动画合成

 

  • 摘要: AniPortrait是一个由音频驱动的项目,能够合成逼真的人像动画。该项目基于Python语言开发,通过声音输入生成生动的肖像表情动态。

 

  1. Jan:开源离线版ChatGPT

 

  • 摘要: Jan是一个开源项目,旨在提供一个与ChatGPT相似的体验,但完全离线运行于个人电脑上。该项目使用TypeScript语言编写。

 

  1. 腾讯ARC发布BrushNet图像修复模型

 

  • 摘要: 腾讯ARC官方实现了论文中的BrushNet模型,这是一个具有分解双分支扩散功能的即插即用图像修复模型,使用Python编写。

 

以上就是2024-04-02的大模型日报,很高兴为你服务!

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/weixin_40725706/article/detail/558925
推荐阅读
相关标签
  

闽ICP备14008679号