实时追踪科研动态丨7.20精选新论文，附ChatPaper综述_challenges and applications of large language mode

作者：不正经 | 2024-04-26 04:47:46

踩

challenges and applications of large language models

作为科研人员，每天需要检索和浏览大量的学术文献，以获取最新的科技进展和研究成果。然而，传统的检索和阅读方式已经无法满足科研人的需求。

ChatPaper，一款集检索、阅读、知识问答于一体的文献知识工具。帮助你快提高检索、阅读论文效率，获取最新领域研究动态，让科研工作更加游刃有余。
在这里插入图片描述

结合前沿动态订阅功能，精选arXiv当日热门新论文，形成论文综述，让大家更加快速了解前沿动态。

如果想要对某篇论文进行深入对话，可以直接复制论文链接到浏览器上或者直达ChatPaper页面：

ChatPaper入口：https://www.aminer.cn/chat/g/

2023年7月20日精选新论文列表：

1.On the Origin of LLMs: An Evolutionary Tree and Graph for 15,821 Large Language Models

链接：https://www.aminer.cn/pub/64b8b1bd3fda6d7f062b9845/

ChatPaper综述：研究指出了一个问题，即由于大型语言模型（LLMs）的广泛使用，了解哪些LLM背景、设置、训练方法和家族受到欢迎或趋势的问题变得非常重要。然而，目前没有一个综合的LLM索引可供使用。因此，该研究利用Hugging Face LLMs的系统命名规则，使用n-grams和词频-逆文档频率进行层次聚类，并识别LLMs之间的关联性，从而解决了这个问题。该研究还开发了一个公共网络应用程序，名为Constellation，用于浏览和探索15,821个LLM的地图，并提供了多种可视化工具来帮助理解数据。

2.DNA-Rendering: A Diverse Neural Actor Repository for High-Fidelity Human-centric Rendering

链接：https://www.aminer.cn/pub/64b8b1c13fda6d7f062bb087/

ChatPaper综述：说明了当前的人类中心渲染数据集和基准测试在多样性方面相对匮乏，并且这种多样性对于渲染效果至关重要。现有数据集限制了研究人员在当前数据集上探索和评估少量渲染问题，而实际应用需要方法能够在不同场景下稳健地工作。为了解决这个问题，作者提出了DNA-Rendering，一个大规模、高保真度的人类表现数据存储库，用于神经演员渲染。该数据集包含1500多个人类主体、5000个动作序列和6750万帧的数据量。此外，作者还为每个主体提供了丰富的资源，包括2D/3D人体关键点、前景掩膜、SMPLX模型、服装/配饰材料、多视图图像和视频。这些资源提高了当前方法在下游渲染任务上的准确性。此外，作者构建了一个专业的多视图系统来捕捉数据，其中包含60个同步摄像机，最大分辨率4096 x 3000，15帧/秒的速度和严格的相机校准步骤，确保了高质量的资源用于任务训练和评估。除了数据集之外，作者还提供了一个大规模的定量基准测试，包括多个任务，用于评估新颖视图合成、新颖姿势动画合成和新颖身份渲染方法的进展。总之，该研究描述了DNA-Rendering的努力，揭示了人类中心渲染的新观察、挑战和未来方向。

3.Android in the Wild: A Large-Scale Dataset for Android Device Control

链接：https://www.aminer.cn/pub/64b8b1c13fda6d7f062bb007/

ChatPaper综述：论文说明了在设备控制系统中存在一种对人类自然语言指令进行解释和在数字设备上直接控制其用户界面执行的兴趣的增长。作者提出了一个用于设备控制研究的数据集Android in the Wild（AITW），该数据集比当前数据集大几个数量级。该数据集包含设备交互的人类演示，包括屏幕和操作，并包含相应的自然语言指令。它包含了715k个情节，涵盖了30k个唯一指令，四个Android版本（v10-13）和八种设备类型（从Pixel 2 XL到Pixel 6），具有不同的屏幕分辨率。它包含了需要对语言和视觉环境进行语义理解的多步任务。这个数据集提出了一个新的挑战：必须从它们的视觉外观中推断出用户界面中的操作。而且，动作空间不是简单的基于UI元素的动作，而是精确的手势（例如，水平滚动以操作轮播小部件）。作者组织了数据集，以促进设备控制系统的鲁棒性分析，即系统在面对新的任务描述、新的应用程序或新的平台版本时的表现如何。作者开发了两个代理并报告了在整个数据集上的性能。

4.FABRIC: Personalizing Diffusion Models with Iterative Feedback

链接：https://www.aminer.cn/pub/64b8b1c13fda6d7f062bb077/

ChatPaper综述：探讨了在生成模型中如何将人类反馈整合到扩散性的文字到图像模型的生成过程中。通过在最常用的架构中利用自注意层来将扩散过程与一组反馈图像相关联，我们提出了一种适用于各种流行扩散模型的无需训练的方法，名为FABRIC。为了确保对我们方法的严格评估，我们引入了一种全面的评估方法学，提供了一种强大的机制来量化整合人类反馈的生成视觉模型的性能。通过详尽的分析，我们展示了随着多轮迭代反馈，生成结果的改进，从而隐式地优化了任意用户偏好。这些发现的潜在应用领域包括个性化内容创建和定制。

5.Text2Layer: Layered Image Generation using Latent Diffusion Model

链接：https://www.aminer.cn/pub/64b8b1bd3fda6d7f062b9835/

ChatPaper综述：现有的图像编辑工作流程中，图层合成是一种非常流行的方法。然而，现有方法中，生成图像和生成图层蒙版是分开进行的。为了改进这一过程，并产生更高质量的图层合成结果，作者提出了一种新的方法，即利用潜在扩散模型进行分层图像生成。他们通过训练一个自动编码器来重构分层图像，并在潜在表示上训练扩散模型，从而同时生成背景、前景、图层蒙版和合成图像。这样的方法不仅能够产生高质量的分层图像，还能改善图层合成工作流程并提供更高质量的图层蒙版。实验结果表明，该方法能够产生高质量的分层图像，并为未来的工作提供了一个基准。

6.DialogStudio: Towards Richest and Most Diverse Unified Dataset Collection for Conversational AI

链接：https://www.aminer.cn/pub/64b8b1c13fda6d7f062bb086/

ChatPaper综述：指出了当前对话AI领域面临的挑战：语言模型在处理多样化对话任务时遇到困难，现有的对话数据集缺乏多样性和全面性。为了解决这些问题，作者介绍了DialogStudio，这是一个最大和最丰富的对话数据集合，统一采用一致的格式，同时保留其原始信息。该数据集合包括来自开放域对话、面向任务的对话、自然语言理解、推荐对话、对话摘要和知识为基础的对话的数据，使其成为对话研究和模型训练的非常丰富和多样化的资源。为了进一步提高DialogStudio的效用，作者确定了每个数据集的许可证，并为选定对话设计了领域感知的提示，以便于指导意识微调。此外，作者使用该数据集合开发了对话AI模型，实验在零样本学习和少样本学习情景下展示了DialogStudio的优越性能。

7.Challenges and Applications of Large Language Models

链接：https://www.aminer.cn/pub/64b8b1c13fda6d7f062bb083/

ChatPaper综述：论文旨在解决大型语言模型（LLMs）领域中存在的挑战和已经成功应用的问题。由于这个领域发展迅速，很难确定还存在哪些挑战和已经取得了成果的应用领域。因此，该论文的目标是提出一系列系统性的开放性问题，并介绍应用方面的成功案例，以便机器学习研究人员能够更快地了解该领域的现状并提高生产力。

8.Towards A Unified Agent with Foundation Models

链接：https://www.aminer.cn/pub/64b8b1bd3fda6d7f062b97b1/

ChatPaper综述：文章说明了在强化学习（RL）代理中，语言模型和视觉语言模型的能力可以被嵌入和利用。这些模型在理解人类意图、推理、场景理解和规划行为等方面表现出前所未有的能力。文章探索了将语言作为核心推理工具的框架，探讨如何通过这种方式使代理能够解决一系列基础RL挑战，例如高效的探索、重用经验数据、调度技能和从观察中学习，这些传统上需要单独设计的垂直算法。作者在一个稀疏奖励的模拟机器人操作环境中测试了他们的方法，其中机器人需要堆叠一组物体。结果表明，在探索效率和能够从离线数据集中重用数据方面，与基准方法相比，该方法取得了显著的性能改进，并展示了如何重用学到的技能来解决新任务或模仿人类专家的视频。

如何使用ChatPaper？

使用ChatPaper的方法很简单，打开AMiner首页，从页面顶部导航栏或者右下角便可进入ChatPaper页面。
在这里插入图片描述
在ChatPaper页面中，可以选择基于单篇文献进行对话和基于全库（个人文献库）对话，可选择上传本地PDF或者直接在AMiner上检索文献。

如果您有任何问题或建议，欢迎随时联系我们。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/不正经/article/detail/489086