当前位置:   article > 正文

【每周精选资讯 | 第 3 期】2024-03-25 ~ 2024-03-31_t-rex2: towards generic object detection via text-

t-rex2: towards generic object detection via text-visual prompt synergy

前言

大家好,我是翼同学。这里是【每周精选资讯】的第三期内容。

通义千问:发布Qwen1.5-MoE-A2.7B模型

通义千问团队推出了首个Mixture of Experts(MoE)模型Qwen1.5-MoE-A2.7B,其27亿个激活参数的设计实现了与70亿参数模型相媲美的性能,训练成本降低75%,推理速度提升1.74倍。

在这里插入图片描述

该模型采用了特别设计的MoE架构,进行了多项改进,包括finegrained experts、新的初始化方法和routing机制。在性能评估方面,该模型在MMLU、GSM8K、HumanEval等评估中展示了其语言理解、数学和代码能力。该模型系列已在ModelScope社区开源,提供了多个版本供下载和使用。通义千问团队还介绍了使用SWIFT框架进行Qwen1.5-MoE模型的微调和微调后推理的方法。

链接:Qwen1.5-MoE: Matching 7B Model Performance with 1/3 Activated Parameters

无问芯穹:发布大模型开发与服务平台

3月31日,上海无问芯穹智能科技有限公司发布了基于多芯片算力底座的“无穹Infini-AI”大模型开发与服务平台,并宣布自3月31日起正式开放全量注册,给所有实名注册的个人和企业用户提供百亿tokens免费配额。

在无问芯穹

无问芯穹成立于2023年5月,创始团队成员来自清华大学电子系及头部科技企业。据悉,该平台目前支持Baichuan2、ChatGLM2、ChatGLM3、ChatGLM3闭源模型、Llama2、Qwen、Qwen1.5系列等共20多个模型,以及AMD、壁仞、寒武纪、燧原、天数智芯、沐曦、摩尔线程、NVIDIA等10余种计算卡,支持多模型与多芯片之间的软硬件联合优化和统一部署。

小米SU7:大模型与全车感知多模态融合

小米汽车首款车型小米SU7已于3月28日震撼发布,这标志着小米正式进入新能源汽车市场。小米SU7的一大亮点是搭载了AI大模型,与小爱同学语音助手相结合,为用户提供了全新的智能驾驶体验。小爱同学自发布以来已有7年时间,目前已拥有1.1亿月活跃用户,每天的激活次数高达2.08亿次。

在这里插入图片描述

小米SU7的智能驾驶系统支持深度语音控制,能够识别模糊指令,并实现五音区语音交互,确保车辆对各个方位的指令都能精准响应。AI大模型的加入使得小米SU7能够识别车前场景,甚至能够识别前车的车型。

AI21推出创新的Jamba模型

AI21公司近日宣布推出Jamba,这是一款基于Mamba的新型生产级模型,结合了传统的Transformer架构元素,旨在克服纯SSM(Structured State Space Model)模型的局限性。Jamba模型以其256K的上下文窗口大小,展现出卓越的吞吐量和效率,预示着这种创新混合架构的潜力。

在这里插入图片描述

Introducing Jamba: AI21’s Groundbreaking SSM-Transformer Model

Hume AI 发布 EVI :具备情感感知能力

近日,Hume AI公司宣布推出了一款新型的情感智能对话系统——EVI。该系统基于先进的情感大语言模型(eLLM),这是一种融合了传统大型语言模型(LLMs)的深度语言理解能力和表情测量技术的情感识别功能的创新技术。

在这里插入图片描述

通过这种独特的技术结合,EVI不仅能够流畅地进行对话,还能够捕捉并理解对话中的声音语调和词语强调等细微的情感变化,从而优化人工智能与人类的互动体验。EVI的一个显著特点是其对对话流畅性的重视。它能够灵敏地响应用户的打断,避免尴尬或对话中断的情况发生。当用户突然插话时,EVI能够像真人一样及时停止,并给予用户发言的空间,展现出高度的适应性和人性化交互能力。

Conversation powered by a new form of empathic AI

Awesome-Generative-AI-Guide

一个一站式的生成式AI资源库,提供了最新的研究更新(包括各项研究的摘要和主题)、免费课程(超过60个与生成式AI相关的免费课程)、面试资源、课程材料以及代码库等。

在这里插入图片描述

T-Rex2:通用目标检测

DeepDataSpace公司近日发布了一项名为T-Rex2的创新技术,通过结合文本和视觉提示,实现了对各种物品的广泛识别,无需针对特定任务进行调整或使用大量训练数据集。

T-Rex2在多个学术基准测试上实现了最先进的性能,适用于多种实际应用场景,包括农业、工业、牲畜和野生动物监测、生物学、医学、OCR、零售、电子、交通、物流等。DeepDataSpace希望通过T-Rex2简化目标检测的复杂性,并促进跨领域的创新和合作。

在这里插入图片描述

T-Rex2: Towards Generic Object Detection via Visual-Text Prompt Synergy

吴恩达:解析 AI Agents 工作流程设计模式“反思”

吴恩达教授近日对AI智能体工作流程设计模式“反思”进行了深度解析。他认为,反思模式相对易于实施,且能带来出乎意料的性能提升。

在这里插入图片描述

反思模式的核心在于让模型自我批评并优化输出。以编程任务为例,首先让大语言模型(LLM)直接生成完成特定任务的代码,然后引导它反思自身的输出,审查代码的准确性、编程风格及效率,并提出改进意见。之后,再次提示LLM,包括先前生成的代码和给出的改进意见,要求其根据反馈重新编写代码。这样的循环可能会带来更加精准的回答。

吴教授还提出,可以为LLM提供工具以帮助其评估输出,如运行单元测试检查代码正确性,或搜索网络验证文本输出的准确性。此外,还可以采用多智能体框架来实施“反思”,通过创建两个不同角色的智能体,一个负责生成高质量的输出,另一个则专注于对前者的输出提出建设性批评。

吴教授表示,虽然“反思”是一种基本的智能体工作流程类型,但在实际应用中,他惊喜地发现它在一些案例中大幅提升了性能。他推荐了几篇关于“反思”深度研究的论文,并表示未来还会介绍更多关于智能体设计模式的内容。

链接:One Agent For Many Worlds, Cross-Species Cell Embeddings, and more

X.AI:宣布推出Grok-1.5模型

Grok-1.5是x.ai公司最新推出的大型语言模型,具备长文本理解和高级推理能力。该模型将在接下来的几天内对早期测试者和现有Grok用户在

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/558932
推荐阅读