赞
踩
整理 | 王启隆
出品 | AI 科技大本营(ID:rgznai100)
一分钟速览新闻点!
商汤最新 AI 模型复现「中国版 GPT-4o」
法国 8 人初创团队打造「开源版 GPT-4o」
百度文心智能体平台免费开放,李彦宏称“开源模型是智商税”
猎豹移动傅盛:付费的闭源大模型才是智商税
浦语灵笔 IXC-2.5:多模态大模型,视频理解与自动生成网站
快手发布可灵网页版及大量模型更新
科大讯飞:预计上半年净亏损 3.8 亿元至 4.6 亿元
智谱 AI 发布开源代码生成模型 CodeGeeX4-ALL-9B
面壁智能推出高效大模型和小钢炮 MiniCPM-S,助力开发者打造超级 App
阶跃星辰发布三款 AI 模型,主打多模态能力
阿里达摩院推出 AI 视频创作平台“寻光” ,实现一站式视频制作
消息称软银正与银行商讨借贷事宜,为 100 亿美元的 AI 争夺战融资
上百元一次的 AI 填报高考志愿靠谱吗?专家称不应过度依赖 AI 填报高考志愿
Deepmind 新算法训练 AI 提效 13 倍,能耗暴降 10 倍
内部人士:AMD 曾经差点收购 NVIDIA,因黄仁勋坚持想当 CEO,交易告吹!
商汤最新 AI 模型复现「中国版 GPT-4o」
商汤发布“日日新 SenseNova 5.5”模型系列,展示类似 GPT-4o 的实时语音对话演示。该模型基于 10 TB 高质量训练数据,采用混合端云协同架构,拥有 6000 亿参数,推理速度达 109.5 字/秒。同时,商汤还推出了可让照片动起来的小程序 Vimi,目前处于内测阶段。
法国 8 人初创团队打造「开源版 GPT-4o」
欧洲 Kyutai 研究实验室近日在巴黎发布了 AI 产品 MoshiAl,这是一个能与人类进行自然对话的 AI 语音助手。Kyutai 为法国的一家 8 人初创团队,声称 MoshiAl 可以匹敌 OpenAl 的 GPT-4o 的语音能力。该语音助手由 8 人团队经过 6 个月的时间开发,具备独特情感和 AI 互动能力。未来 Kyutai 将公开 Moshi 的代码和模型权重,使研究人员和开发人员能够自由使用、改进和扩展这项技术。
以上新闻展示出世界各地开始复现 OpenAI 迟迟未完整发布的 GPT-4o,重演了二月份的「Sora 复现热潮」以及后来的「AI 程序员 Devin 复现热潮」。
百度文心智能体平台免费开放,李彦宏称“开源模型是智商税”
近日,百度宣布其文心智能体平台(AgentBuilder)免费开放了文心大模型 4.0。开发者在制作智能体时,可灵活选择文心大模型 3.5 或 4.0 版本。同时,百度创始人李彦宏再次发表名言:“开源模型是智商税”。此次免费开放将有助于推动 AI 技术的发展和应用。
猎豹移动傅盛:付费的闭源大模型才是智商税
在 2024 世界人工智能大会(WAIC 2024)期间,猎豹移动董事长兼 CEO、猎户星空董事长傅盛视频号评论“开源大模型是智商税”的说法,他表示,大模型的发展,开源闭源不是核心的问题,但真要说智商税,现在收很高的模型授权费、API费,才是智商税。
“从逻辑上来说,开源大模型是免费的;从事实上来说,开源大模型各种性能已经够好,很多企业都在用开源大模型,他们也没向谁交钱。”但是反观闭源大模型,“哪怕对用户,一个月要交几十块钱才能用的那种闭源大模型,也是智商税。” 傅盛认为,真正要把大模型用好,就得结合企业的实际,做应用侧的落地,今天 AI 的使用,选择模型是一方面,另一方面是要做好应用,做不好应用,付费肯定是上不去的,即使免费也不能起到好的效果。
浦语灵笔 IXC-2.5:多模态大模型,视频理解与自动生成网站
上海人工智能实验室近日开发的浦语灵笔 IXC-2.5 是一个具备 7B LLM 后端的多模态大模型,拥有与 GPT-4V 相当的能力。它不仅能够进行超高分辨率图像和精细视频理解,还能实现多轮多图像对话。此外,浦语灵笔 IXC-2.5 还扩展了网页制作和高质量文本-图像文章创作应用,能够生成逻辑连贯、高标准的长文本内容。
体验链接:https://huggingface.co/spaces/Willow123/InternLM-XComposer
快手发布可灵网页版及大量模型更新
快手近日发布了可灵网页版和大量模型更新,新模型输出分辨率为 720P,美观度一致性和运动幅度有所提高。此外,还增加了创意幅度、运镜控制、反向提示词输入等功能。目前,可灵模型限时免费,高表现模式每天三次。
科大讯飞:预计上半年净亏损 3.8 亿元至 4.6 亿元
近日,科大讯飞公告,预计上半年净亏损 3.8 亿元至 4.6 亿元,上年同期盈利 7357.2 万元。公司在全力加大“讯飞星火大模型”研发投入的同时,加快了大模型的落地推广力度。
智谱 AI 发布开源代码生成模型 CodeGeeX4-ALL-9B
智谱 AI 最新发布的 CodeGeeX4-ALL-9B 模型,集成了代码补全、生成、问答、解释器及工具调用等多功能,实现了项目级代码问答能力。同时,该模型开源代码,为开发者提供强大的编程工具,推动编程技术的创新和应用。
面壁智能推出高效大模型和小钢炮 MiniCPM-S,助力开发者打造超级 App
面壁智能联合创始人刘知远在 WAIC 2024 论坛上首次对外介绍开源新一代高效、低能耗的面壁小钢炮 MiniCPM-S 模型和全栈工具集 MobileCPM,帮助开发者一键打造大模型超级 App。MiniCPM-S 采用高度稀疏架构,实现高稀疏度、快速推理和无损性能,将知识密度提升至同规模稠密模型的 2.57 倍。此外,MobileCPM 工具集支持一键集成端侧大模型到 App,提供三种模式满足不同需求,现已支持 iOS 系统,Android 版本即将上线。
阶跃星辰发布三款 AI 模型,主打多模态能力
阶跃星辰在 WAIC 发布多模态模型,包括万亿参数的 MoE 模型 Step-2,千亿参数多模态模型 Step-1.5V 及图像生成模型 Step-1X。其中,Step-1.5V 支持图片和视频理解,Step-1X 则对中国文化和元素进行优化。目前,Step-2 需申请体验,且需要自行调用。
阿里达摩院推出 AI 视频创作平台“寻光” ,实现一站式视频制作
阿里达摩院最新推出的“寻光”平台,实现了视频创作的全过程集成,包括剧本创作、分镜设计、素材编辑等关键步骤。这一平台通过 AI 技术简化了视频制作流程,提高了内容创作者的工作效率,标志着 AI 在多媒体内容创作领域的进一步应用。
消息称软银正与银行商讨借贷事宜,为 100 亿美元的 AI 争夺战融资
知情人士称,软银最近与银行进行了接触,为高达 100 亿美元的能源相关投资项目进行融资。而这些能源相关的项目正是由当前的 AI 热潮所驱动。近期,在沉寂了大约一年之后,软银 CEO 孙正义又重新回归公众视线。他谈到了对 AI 未来的兴奋,以及如何让软银成为 AI 领域的领导者。显然,这一计划不仅复杂,而且成本高昂。据预计,英伟达目前控制着用于训练和部署 OpenAI GPT 等模型的 AI 芯片市场的 70% 至 95% 的份额。(新浪财经)
上百元一次的 AI 填报高考志愿靠谱吗?专家称不应过度依赖 AI 填报高考志愿
近日,不少家长和考生表示,高考结束后,他们在填报志愿时要查阅大量高校和专业信息,而借助 AI 填报高考志愿,既省时又不费力。记者在某应用商店随机下载几款软件,打开一个 AI 志愿填报系统,输入高考省份、科目、分数等考生信息,就可以生成一张按“冲稳保”顺序依次排列的高校及专业名单。这些软件和商品信息既有免费,也有付费,而付费价格一般在百元到数百元。(央广网)
Deepmind 新算法训练 AI 提效 13 倍,能耗暴降 10 倍
最近,谷歌 DeepMind 研究团队提出了一种加快 AI 训练的新方法 —— 多模态对比学习与联合示例选择(JEST),大大减少了所需的计算资源和时间。JEST 以 13 倍更少的迭代次数,以及 10 倍更少的计算量,超越了最先进的模型。
论文链接:https://arxiv.org/pdf/2406.17711
内部人士:AMD 曾经差点收购 NVIDIA,因黄仁勋坚持想当 CEO,交易告吹!
曾在 AMD 工程部门工作了 6 年多的 Hemant Mohapatra 于近日在 X 上分享了一则往事,他表示,「事实上,AMD 差点收购 NVIDIA,但黄仁勋不同意,除非他取代 AMD 的 Hector Ruiz 成为合资公司的首席执行官。如果那样的话,世界将会大不相同。」
最终,2006 年 7 月,AMD 宣布耗资 54 亿美元,收购了 NVIDIA 的死对头 —— ATI。AMD 的另一位前员工 Phil Park,也确认了上述说法。(快科技)
大模型刷新一切,让我们有着诸多的迷茫,AI 这股热潮究竟会推着我们走向何方?面对时不时一夜变天,焦虑感油然而生,开发者怎么能够更快、更系统地拥抱大模型?《新程序员 007》以「大模型时代,开发者的成长指南」为核心,希望拨开层层迷雾,让开发者定下心地看到及拥抱未来。
读过本书的开发者这样感慨道:“让我惊喜的是,中国还有这种高质量、贴近开发者的杂志,我感到非常激动。最吸引我的是里面有很多人对 AI 的看法和经验和一些采访的内容,这些内容既真实又有价值。”
能学习到新知识、产生共鸣,解答久困于心的困惑,这是《新程序员》的核心价值。欢迎扫描下方二维码订阅纸书和电子书。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。