当前位置:   article > 正文

大模型日报2024-04-28

大模型日报2024-04-28

大模型日报

2024-04-28

大模型资讯

  1. 苹果推出8款小型AI语言模型,与微软Phi-3竞争

  • 摘要: 苹果公司最新发布了8款小型人工智能语言模型,旨在与微软的Phi-3展开竞争。这标志着AI领域的竞争焦点,正在从打造最大的模型转向开发最小、最高效的工具。这些小型模型的推出,进一步加剧了AI技术的市场竞争。

  1. ETRI开发自动化语言任务规划基准测试

  • 摘要: 韩国电子通信研究院(ETRI)开发了一种自动化的语言任务规划基准测试,此举旨在降低成本和缩短时间,同时实现客观评估。该测试对33个语言模型(LLM)进行了评估,并揭示了实现改进的策略。

  1. 融合大型语言模型与图机器学习:全面回顾

  • 摘要: 图在表示社交网络、知识图谱和分子结构等领域的复杂关系中扮演重要角色。本文回顾了大型语言模型与图机器学习的整合应用,探讨了这一跨学科领域的最新进展,为相关研究和实践提供了全面的概述。

  1. 苹果在iOS 18发布前夕展示其AI语言模型

  • 摘要: 随着iOS 18的即将到来,苹果公司近日提供了其人工智能语言模型的预览。此前,苹果在生成性AI领域相对保持沉默。这一动作表明苹果正准备加入AI竞赛,可能会为即将推出的操作系统带来新的AI功能。

  1. 微软推出新型小型语言模型

  • 摘要: 在众多关于大型语言模型(LLMs)的讨论中,微软最新发布了其小型语言模型。该模型是微软针对市场需求推出的一种技术创新,旨在提供更加高效、便捷的语言处理解决方案。这标志着微软在人工智能领域的又一进展,有望为用户带来更多的选择和便利。

  1. 研究人员开发语言任务规划自动化基准测试

  • 摘要: 科研团队开发了一种自动化基准测试,用于评估语言为基础的任务规划系统。该系统能指导机器人执行特定任务,例如被告知“将一个冷却的苹果放入微波炉”时,机器人首先需要找到苹果。这项技术旨在提高机器人理解和执行语言指令的能力。

  1. Mini-Gemini:挖掘多模态视觉语言模型的潜力

  • 摘要: 近期,大型语言模型的飞速进展极大推动了自然语言处理(NLP)的发展。Mini-Gemini是一种新兴的多模态视觉语言模型,旨在通过结合视觉和语言信息来提升机器理解和生成能力,为NLP领域带来新的研究和应用潜力。

  1. Awarri在尼日利亚推出首个多语言大型语言模型加速AI发展

  • 摘要: Awarri,一家推动非洲人工智能(AI)技术的公司,近日宣布推出尼日利亚首个多语言大型语言模型。该模型旨在加速尼日利亚乃至整个非洲地区的AI技术应用和发展,通过支持多种语言,增强AI在地域语境中的适用性和普及度。

  1. 使用动态定义增强技术提升生物医学命名实体识别的AI新方法

  • 摘要: 研究者开发了一种新的人工智能方法,通过动态定义增强技术来提高大型语言模型在生物医学命名实体识别任务中的准确性。这一方法能够动态地为模型提供相关定义,从而帮助模型更准确地识别和处理生物医学文献中的专业术语和实体。

  1. Snowflake推出企业级大型语言模型Arctic,采用MoE架构

  • 摘要: Snowflake公司最新发布了名为Arctic的大型语言模型,该模型基于独特的Mixture-of-Experts(MoE)架构,旨在提供顶尖的智能水平和无与伦比的效率。Arctic被设计成为最开放的企业级语言处理平台,能够在大规模应用中保持高效运行。

大模型产品

  1. Langfuse 2.0:开源LLM工程平台

  • 摘要: Langfuse 2.0是一款开源的大型语言模型(LLM)工程平台,提供了可观测性、追踪、评估、提示管理、游乐场和度量工具,用以调试和优化LLM应用。支持任何模型和框架,且可导出所有数据。

  1. CopyCopter:AI文转视频工具

  • 摘要: CopyCopter是一款AI生成工具,能将文本内容(博客、通讯、想法或网站)快速转换成具有传播潜力的TikTok和Shorts短视频。用户无需编辑技能,即可在几秒内创建和编辑社交媒体视频。

  1. AI or Not:AI内容检测工具

  • 摘要: AI or Not是一个被超过10万用户信赖的AI检测器,能够免费识别图像、音频和KYC身份文件中的AI生成内容。它帮助企业防止欺诈,加强内容审核,预防KYC诈骗。

  1. Hyra:沉浸式AI读书应用

  • 摘要: Hyra是首款为Apple Vision Pro设计的应用,通过AI技术,根据读者正在阅读的书籍内容,创造出全面沉浸式的场景体验。

  1. AI博客文章:提升网站流量

  • 摘要: AI博客文章是一款AI驱动的内容创作工具,利用最新的大型语言模型(LLMs),专门生成优化搜索引擎的博客文章,助力提升您网站的流量。

  1. HelloRAG:高效文档结构化工具

  • 摘要: HelloRAG.ai专门转换复杂文档,如带表格和图表的PDF,生成结构化和LLM友好数据,适配任意向量数据库,大规模提升AI数据准备效率。

  1. ALIagents.ai:链上AI代理创作平台

  • 摘要: ALIagents.ai是基于AI协议的去中心化应用,允许用户自主创建、定制及盈利自己的情感丰富、表现力强的链上AI代理。该平台提供了一种新方式,让用户能够生成和管理自己的AI系统。

  1. Deepwander:AI助力深度自省

  • 摘要: Deepwander是一款AI驱动的自省工具,旨在提升用户的自我意识。它帮助用户深入探索自己的思想、情感和行为,支持他们根据个人价值和抱负进行自我发现之旅。

  1. Wonderplan.ai 2.0:智能旅行规划

  • 摘要: Wonderplan.ai 2.0通过AI帮助用户轻松创建独特的旅行计划。用户可从零开始或利用博客和视频,通过个性化选项进行微调。享受交互式聊天、基于日历的规划以及免费地图行程预览的便捷体验。

  1. SortResume.ai:AI招聘小助手

  • 摘要: SortResume.ai是首款AI招聘助手,旨在节省招聘时间,提高效率。通过领先排行榜和分析报告,轻松筛选简历,准确识别顶尖候选人,无压力、零失误。

大模型论文

  1. Make-it-Real: 3D对象真实材质绘制

  • 摘要: 本文利用多模态大型语言模型GPT-4V,提出一种新方法Make-it-Real,通过识别描述材质,精确匹配并生成3D对象的真实材质,简化3D内容创作流程。

  1. IndicGenBench:评估印度语系LLMs

  • 摘要: IndicGenBench是一个多语言基准测试,用于评估大型语言模型在29种印度语言上的生成能力。该基准包含多种任务,如跨语言摘要、机器翻译和问答。研究发现,尽管PaLM-2模型表现最佳,但与英语相比,所有语言都有显著的性能差距。

  1. 利用IN2训练提升LLM上下文利用

  • 摘要: 研究提出信息密集型训练(IN2)解决大型语言模型(LLMs)长上下文信息利用不足的问题。通过在Mistral-7B上应用IN2,开发出FILM-7B模型,显著提高长上下文任务性能,并保持短上下文任务表现。

  1. 提升常识生成多样性的大型语言模型

  • 摘要: 研究提出一种简单方法,通过上下文学习来增强大型语言模型在常识性推理生成任务中的多样性,同时保持输出质量。在三个基准数据集上的实验结果表明,该方法在保质增多方面取得了理想平衡。

  1. AAPL:为视觉-语言模型增添属性

  • 摘要: 本文提出了AAPL机制,通过对抗性标记嵌入优化视觉-语言模型的提示学习,解决了传统图像增强带来的偏见问题,有效提升了模型在少样本学习、零样本学习、跨数据集和领域泛化任务中的性能。

  1. 弱变强模型对齐加速方法

  • 摘要: 本文提出了一种名为ExPO的方法,通过模型权重外推,无需额外训练即可提升大型语言模型与人类偏好对齐的能力。在AlpacaEval 2.0基准测试中验证了该方法的有效性。

  1. 多模态大语言模型视觉理解基准测试

  • 摘要: 本研究提出了SEED-Bench-2-Plus基准测试,旨在评估多模态大语言模型在文本丰富的视觉内容理解方面的能力。涵盖图表、地图和网页三大类别,包含2.3K个带有精确人类注释的多项选择题。

  1. 大型语言模型持续学习综述

  • 摘要: 本文综述了大型语言模型(LLMs)在持续学习(CL)背景下的研究进展。探讨了垂直和水平持续学习途径,总结了持续预训练、领域适应性预训练和持续微调的三个阶段,并讨论了评估协议和数据源。

  1. PreTTY:跨语言模型无需训练对齐

  • 摘要: 本文提出了一种名为PreTTY的新方法,通过使用少量相关前置词汇,无需额外训练即可使基础大型语言模型(LLM)实现高效的跨语言生成,与经过监督微调(SFT)的LLM表现相当,节省成本,促进多语言LLM的普及。

大模型开源项目

  1. Doriandarko:智能子代理框架

  • 摘要: Doriandarko是一个用Python编写的框架,旨在为Claude Opus提供智能化的子代理协调功能,助力于AI项目的高效管理。

  1. Apple发布CoreNet深度学习库

  • 摘要: Apple的CoreNet是一个用Python编写的库,专门用于训练深度神经网络。它提供了强大的功能和工具,帮助研究人员和开发者构建、训练和部署复杂的机器学习模型。

  1. MyShell AI:即时语音克隆技术

  • 摘要: MyShell AI项目允许用户通过即时语音克隆技术复制特定声音。该项目使用Python编写,便于开发者学习和应用。

  1. Open-Sora:高效视频制作民主化

  • 摘要: hpcaitech开发的Open-Sora项目旨在普及高效视频制作。该项目使用Python语言编写,通过开源的方式使得更多人能够访问和使用先进的视频处理技术,降低技术门槛,推动视频制作领域的创新和发展。

  1. Chat2DB:AI数据管理平台

  • 摘要: Chat2DB是一个火热的AI驱动的数据管理平台,已有超过一百万开发者使用。该项目使用Java语言编写,专注于通过AI技术优化数据库交互和管理。

  1. iperov: 实时面部置换项目

  • 摘要: iperov是一款用Python编写的AI项目,可实现PC流媒体或视频通话中的实时面部置换功能,使用户能够在直播或视频会议中更换面孔。

  1. EricLBuehler:高速LLM推理库

  • 摘要: EricLBuehler是一个Github上的AI项目,使用Rust语言编写,专注于提供极速的大型语言模型(LLM)推理能力,旨在优化性能和效率。

  1. binary-husky: LLM交互接口优化

  • 摘要: binary-husky项目旨在为GPT/GLM等大型语言模型提供优化的交互界面。它具备模块化设计,可自定义操作,支持多语言代码分析、PDF/LaTex文档处理,以及多模型并行查询等功能。

  1. OpenInterpreter:自然语言计算接口

  • 摘要: OpenInterpreter是一个用Python编写的AI项目,旨在提供一个自然语言的计算机接口,让用户能够用日常语言与电脑交互。
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家自动化/article/detail/521290
推荐阅读
相关标签
  

闽ICP备14008679号