每周AI新闻（2024年第8周）谷歌推出开源大模型Gemma | Groq自研AI芯片 | 英伟达成立GEAR研究具身智能体

作者：小小林熬夜学编程 | 2024-03-24 01:54:34

踩

这里是陌小北，一个正在研究硅基生命的碳基生命。正在努力成为写代码的里面背诗最多的，背诗的里面最会写段子的，写段子的里面代码写得最好的…厨子。

每周日解读每周AI大事件。

大厂动向

【1】谷歌推出最强开源大模型Gemma

谷歌发布开源模型Gemma，Gemma主打轻量级、高性能，有20亿、70亿两种参数规模，能在笔记本电脑、台式机、物联网设备、移动设备和云端等不同平台运行。性能方面，Gemma在18个基准测评中平均成绩击败目前的主流开源模型Llama 2和Mistral，特别是在数学、代码能力上表现突出，还登顶Hugging Face开源大模型排行榜。

Gemma开源地址：https://www.kaggle.com/models/google/gemma/code

技术报告地址：https://storage.googleapis.com/deepmind-media/gemma/gemma-report.pdf

【2】英伟达成立“GEAR”，打造具身智能体的基础模型

英伟达成立了新的研究部门“GEAR”，由AI高级研究科学家和教授领导，旨在打造具身智能体的基础模型，实现跨多模态、多场景的智能应用。GEAR研究团队专注于多模态基础模型、通用型机器人研究、虚拟世界中的基础智能体以及模拟与合成数据技术，开放了多个职位申请。

【3】英伟达已开始为中国市场提供两款新AI芯片样品

据英国路透社报道，英伟达CEO黄仁勋在发布公司2023年第四季度财报后接受采访时透露，英伟达目前正在向客户提供针对中国市场的两款新型AI芯片样品。“我们现在正和客户一起测试，它们（两款新AI芯片）都在没有许可证的情况下遵守了（美国出口管制）规定，我们正等待客户的反馈。”

【4】谷歌与英伟达合作优化Gemma

谷歌与英伟达宣布合作，利用英伟达TensorRT-LLM对谷歌开源大模型Gemma进行优化。英伟达上周刚发布的聊天机器人Chat with RTX也将很快增加对Gemma的支持。

【5】OpenAI工程师曝工作时间表

OpenAI研究员Jason Wei在社交平台X上分享了自己工作的一天：9点起床，10点开会，6点吃完饭，7点回家后继续写代码、做实验，直到凌晨1点15就寝。Meta FAIR研究院研究员、高级经理田渊栋对此评价：都说国外没有996，其实真正可怕的是自我驱动的卷。

创业 & 投融资

【1】创企Groq自研AI芯片推理速度超英伟达GPU十倍

近日，AI芯片创企Groq推出了Mixtral 8x7B API，据AI模型和托管提供商ArtificialAnalysis.ai的测评数据，该接口创下了新的大模型吞吐量记录，达到每秒430 Tokens。Groq还提供Llama2 7B模型访问，最高可实现每秒750 Tokens。据介绍，Groq平台基于其自研LPU（语言处理单元）芯片运行，该芯片在大模型推理任务上速度是英伟达GPU的10倍。Groq由谷歌前员工乔纳森·罗斯（Jonathan Ross）在2016年创立，主要针对云计算市场开发AI芯片，其主要成员曾参与研发谷歌的TPU（张量处理单元）。

【2】Anthropic一年内融资73亿美元

据《纽约时报》今日报道，Anthropic成为AI领域最热门的创企之一，该公司在过去一年中筹集了73亿美元，投资者包括谷歌、亚马逊、Salesforce等。知情人士透露，该公司去年的月收入约为800万美元，今年预计增长8倍左右。

【3】人形机器人独角兽Figure AI融资6.75亿美元

据彭博社2月24日援引知情人士消息，杰夫·贝佐斯、英伟达及其他大型科技公司正在投资一家开发类人机器人的企业Figure AI。Figure AI在新一轮融资中筹集了约6.75亿美元，融资前估值约为20亿美元。贝佐斯通过他的公司Explore Investments LLC承诺投资1亿美元，微软将投资9500万美元，而英伟达和亚马逊附属基金各提供5000万美元。

【4】生成式AI创企Abridge完成1.5亿美元融资

据英国路透社报道，生成式AI初创公司Abridge今日宣布成功完成了1.5亿美元的C轮融资。Abridge是一家开发AI驱动的临床文档工具的初创公司，该公司告诉路透社，随着越来越多的投资者寻求接触特定行业的生成式AI应用程序，该公司已在C轮融资中筹集了1.5亿美元，由Lightspeed Venture Partners和Redpoint Ventures领投，对Abridge的估值约为8.5亿美元。根据PitchBook的数据，该公司上次融资仅四个月前，当时估值超过2亿美元。

产品 & 模型

【1】字节发布文生图开放模型SDXL-Lightning

字节发布文生图开放模型SDXL-Lightning。SDXL-Lightning跻身模型趋势榜，同时成为Hugging Face Spaces上的热门模型。与SDXL-Lightning一同上榜的是谷歌新近推出的“最强开放大模型”Gemma系列，以及Stability AI的新一代文生图模型Stable Cascade。

字节跳动的SDXL-Lightning通过渐进式对抗蒸馏的技术，实现前所未有的生成速度。该模型能够在2步或4步内生成极高质量和分辨率的图像，将生成速度加快10倍，是1024分辨率下速度最快的文生图模型，计算成本则降低为1/10。SDXL-Lightning可作为增速插件无缝整合到卡通、动漫等多样风格的SDXL模型中，并支持当前流行的控制插件ControlNet、生成软件ComfyUI

【2】Stable Diffusion 3.0发布

根据AI创企Stability AI官网，Stability AI于当地时间2月22日推出AI文生图工具新版本Stable Diffusion 3，开放提前预览版申请通道。Stable Diffusion 3主要在多主题提示、图像质量和文字渲染能力方面大幅提高性能。目前，Stable Diffusion 3模型套件的参数范围为从800M到8B，模型采用了类似Sora的Diffusion Transformer架构。

【3】AI视频生成工具Stable Video开放公测

根据AI创企Stability AI官网，Stability AI旗下的视频生成产品Stable Video于当地时间2月21日开放公测，产品基于Stable Video Diffusion 1.1架构打造，支持文生视频和图生视频功能。

【4】UC伯克利大世界模型登GitHub热榜第一

UC伯克利大学研究人员提出的大世界模型（Large World Model，LWM）登上GitHub榜首，目前已经揽获3.2K星标。为了应对内存限制、计算复杂性和数据集有限等挑战，研究人员从数百万个视频和语言序列的标记中学习，整理了一个包含各种视频和书籍的大型数据集，利用RingAttention技术对长序列进行可扩展训练，并逐渐将上下文大小从4000 tokens增加到100万tokens，并完全开源一系列7B参数模型。论文中提到，LWM可以回答超过1小时的YouTube视频中的相关问题，还能在100万tokens的上下文窗口内实现高精度检索，并且性能优于GPT-4V和Gemini Pro。

论文地址：https://largeworldmodel.github.io/

项目地址：https://github.com/LargeWorldModel/LWM?tab=readme-ov-file

如果觉得不错，随手点个赞、评论、转发吧。我是陌小北，一个正在研究硅基生命的、有趣的碳基生命。如果你想第一时间看到我的文章，欢迎关注。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/299098