当前位置:   article > 正文

大模型日报-20240118

大模型日报

微软TaskWeaver开源框架:携手数据分析与行业定制,打造顶级Agent解决方案

链接:https://news.miracleplus.com/share_link/15912

在这里插入图片描述
数据分析一直是现代社会中的重要工具,它帮助我们洞察本质、发现规律并指导决策。然而,数据分析过程往往复杂且费时,因此我们期望存在一个智能助手助力用户直接 “与数据对话 “。得益于大语言模型(LLM)的发展,虚拟助手和 Copilot 等智能 Agent 纷纷涌现,它们在自然语言理解和生成方面的表现令人叹为观止。但遗憾的是,在处理复杂数据结构(如 DataFrame, ndarray 等)和引入领域知识方面,现有的 Agent 框架仍然举步维艰,而这恰恰是数据分析和专业领域中的核心需求。为了突破这一瓶颈,微软推出了 TaskWeaver—— 一款代码优先的 Agent 框架。TaskWeaver 能够将用户的自然语言请求巧妙地转化为可执行代码,并支持丰富的数据结构、动态插件选择以及专业领域适应的规划过程。

在24项场景中优于人类医生,Google团队开发基于自博弈的诊断对话大模型

在这里插入图片描述
链接:https://news.miracleplus.com/share_link/15915

医学的核心在于医患对话,熟练的病史采集为准确的诊断、有效的管理和持久的信任铺平了道路。能够进行诊断对话的人工智能(AI)系统可以提高护理的可及性、一致性和质量。然而,学习临床医生的专业知识是一个巨大的挑战。Google Research 和 Google DeepMind 的 AI 团队开发了 AMIE(Articulate Medical Intelligence Explorer),这是一种基于大型语言模型(LLM)的人工智能系统,针对诊断对话进行了优化。AMIE 使用一种新颖的基于自博弈(self-play)的模拟环境,具有自动反馈机制,可在不同的疾病状况、专业和背景下扩展学习。「据我们所知,这是第一次针对诊断对话和获取临床病史进行最佳设计的对话式人工智能系统。」 Google Health 的临床研究科学家、论文的合著者 Alan Karthikesalingam 说道。

上海人工智能实验室团队开发具有多核光纤单元旋转功能的AI驱动投影断层扫描

在这里插入图片描述
链接:https://news.miracleplus.com/share_link/15916
光学断层扫描已成为一种非侵入性成像方法,可提供对亚细胞结构的三维洞察,从而能够更深入地了解细胞功能、相互作用和过程。传统的光学断层扫描方法受到有限的照明扫描范围的限制,导致分辨率各向异性和细胞结构的不完整成像。为了克服这个问题,上海人工智能实验室、德国德累斯顿工业大学(Technische Universität Dresden)以及马克斯·普朗克学会(Max Planck Society)的研究人员采用了紧凑的多核光纤细胞旋转器系统,该系统有助于对微流控芯片内的细胞进行精确的光学操纵,从而实现具有各向同性分辨率的全角度投影断层扫描。此外,研究人员展示了人工智能驱动的断层扫描重建工作流程,它可以是从通常需要手动处理的传统计算方法到完全自主过程的范式转变。所提出的细胞旋转断层扫描方法的性能通过细胞模型和 HL60 人类癌细胞的三维重建得到验证。

微软Copilot大会员来了:每月20刀,人人都能用

在这里插入图片描述
链接:https://news.miracleplus.com/share_link/15917

去年 9 月,微软宣布了大模型 Copilot 能力加入 Office 和 Windows 11 的新计划。今天,该能力终于覆盖到了全体用户。1 月 15 日,微软正式发布 Copilot Pro,其每月订阅费用为 20 美元,可解锁访问 Word、Excel 和 PowerPoint 等 Office 常用办公软件中的大模型能力,同时优先访问最新的 OpenAI 模型。在其之上,你也可以基于需求构建起属于自己的 Copilot GPT。

智谱发布GLM-4全家桶:性能提升60%,多模态、128K长文本,全能All Tools及GPTs商店

在这里插入图片描述
链接:https://news.miracleplus.com/share_link/15918

国产大模型玩家智谱AI,交出最新成绩单——发布全自研第四代基座大模型GLM-4,且所有更新迭代的能力全量上线。作为国内唯一一个产品线全对标OpenAI的大模型公司,智谱年前攒了波大的:按官方说法,GLM-4性能相比GLM-3提升60%,逼近GPT-4。而同时推出的GLM-4-All Tools,能够完成用户意图理解-复杂指令规划-自由调用GLM生态的多种模型能力。值得一提的是,智谱发布了GLMs,为所有开发者提供AI智能体定制能力,简单prompt指令就能创建个性化GLM智能体。

MiniMax 国内首个 MoE 大语言模型全量上线啦

在这里插入图片描述
链接:https://news.miracleplus.com/share_link/15919

今天,经过了半个月的部分客户的内测和反馈,MiniMax 全量发布大语言模型 abab6,为国内首个 MoE 大语言模型。在 MoE 结构下,abab6 拥有大参数带来的处理复杂任务的能力,同时模型在单位时间内能够训练足够多的数据,计算效率也可以得到大幅提升。改进了 abab5.5 在处理更复杂、对模型输出有更精细要求场景中出现的问题。

开源模型新纪录:超越Mixtral 8x7B Instruct的模型来了

在这里插入图片描述

链接:https://news.miracleplus.com/share_link/15920

从 Llama、Llama 2 到 Mixtral 8x7B,开源模型的性能记录一直在被刷新。由于 Mistral 8x7B 在大多数基准测试中都优于 Llama 2 70B 和 GPT-3.5,因此它也被认为是一种「非常接近 GPT-4」的开源选项。在前段时间的一篇论文中,该模型背后的公司 Mistral AI 公布了 Mixtral 8x7B 的一些技术细节,并推出了 Mixtral 8x7B – Instruct 聊天模型。该模型性能在人类评估基准上明显超过了 GPT-3.5 Turbo、Claude-2.1、Gemini Pro 和 Llama 2 70B 聊天模型。在 BBQ 和 BOLD 等基准中,Mixtral - Instruct 也显示出更少的偏见。但最近,Mixtral Instruct 也被超越了。一家名叫 Nous Research 的公司宣布,他们基于 Mixtral 8x7B 训练的新模型 ——Nous-Hermes-2 Mixtral 8x7B 在很多基准上都超过了 Mixtral Instruct,达到了 SOTA 性能。

MAGNeT:一个单一的非自回归模型,用于文本到音乐和文本到声音的生成,质量与SOTA模型相当,同时速度提高7倍

链接:https://news.miracleplus.com/share_link/15923
很高兴分享MAGNeT

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/300695
推荐阅读
相关标签