EMNLP 2022最佳长论文、最佳短论文等奖项公布！

作者：Gausst松鼠会 | 2024-05-17 13:55:59

踩

emnlp杰出论文

每天给你送来NLP技术干货！

转载自：机器之心 | 编辑：蛋酱、小舟

来自美国康奈尔大学等机构的研究团队获得了最佳长论文奖，泰国的研究者获得了本次的最佳短论文奖。

近日，自然语言处理领域顶级会议 EMNLP 2022 在阿联酋首都阿布扎比举行。

今年的大会共有投稿 4190 篇，最终 829 篇论文被接收（715 篇长论文，114 篇论文），整体接收率为 20%，与往年差异不大。

大会于当地时间 12 月 11 日落幕，同时也公布了本届论文奖项，包括最佳长论文（1 篇）、最佳短论文（1 篇）、最佳 Demo 论文（1 篇）。

最佳长论文

论文：Abstract Visual Reasoning with Tangram Shapes

作者：Anya Ji , Noriyuki Kojima, Noah Rush, Alane Suhr, Wai Keen Vong , Robert D. Hawkins, Yoav Artzi
机构：康奈尔大学、纽约大学、艾伦研究所、普林斯顿大学
论文链接：https://arxiv.org/pdf/2211.16492.pdf

论文摘要：在这篇论文中，研究者介绍了「KiloGram」，一个用于研究人类和机器的抽象视觉推理的资源库。KiloGram 在两个方面极大地改进了现有资源。首先，研究者策划并数字化了 1016 个形状，创造了一个比现有工作中使用的集合大两个数量级的集合。这个集极大地增加了对整个命名变化范围的覆盖，提供了一个关于人类命名行为的更全面的视角。第二，该集合不是把每个七巧板当作一个单一的整体形状，而是当成由原始的拼图碎片构成的矢量图形。这种分解能够对整个形状和它们的部分进行推理。研究者利用这个新的数字化七巧板图形集合来收集大量的文本描述数据，反映了命名行为的高度多样性。

研究者利用众包来扩展注释过程，为每个形状收集多个注释，从而代表它所引起的注释的分布，而不是单一的样本。最终总共收集了 13404 个注释，每个注释都描述了一个完整的物体及其分割的部分。

KiloGram 的潜力是广泛的。研究者用该资源评估了最近的多模态模型的抽象视觉推理能力，并观察到预训练的权重表现出有限的抽象推理能力，而这一能力随着微调的进行而得到极大的改善。他们还观察到，明确的描述部分有助于人类和模型的抽象推理，特别是在对语言和视觉输入进行联合编码时。

图 1 是两个七巧板的例子，每个七巧板都有两个不同的注释。每个注释都包括整个形状的描述（黑体），对部分的分割（彩色），以及各部分的命名（与每个部分相连）。上面的例子显示了接近完美一致的低可变性，而下面的例子显示了语言和分割的分歧的高可变性。

KiloGram 地址：https://lil.nlp.cornell.edu/kilogram

本次大会的最佳长论文提名由 Kayo Yin 和 Graham Neubig 两位研究者获得。

论文：Interpreting Language Models with Contrastive Explanations

作者：Kayo Yin, Graham Neubig

论文摘要：模型的可解释性方法经常被用来解释 NLP 模型在诸如文本分类等任务上的决策，这些任务的输出空间相对较小。然而，当应用于语言生成时，输出空间往往由数以万计的 token 组成，这些方法无法提供翔实的解释。语言模型必须考虑各种特征来预测一个 token，如它的词性、数字、时态或语义。由于现有的解释方法将所有这些特征的证据合并成一个单一的解释，这对于人类的理解来说可解释性较差。

为了区分语言建模中的不同决策，研究者探讨了专注于对比性解释的语言模型。他们寻找到突出的输入 token，解释为什么模型预测了一个 token 而不是另一个 token。研究证明了在验证主要的语法现象方面，对比性解释比非对比性解释要好得多，而且它们大大改善了人类观察者的对比性模型可模拟性。研究者还确定了模型使用类似证据的对比性决策组，并且能够描述模型在各种语言生成决策中使用哪些输入 token。

代码地址：https://github.com/kayoyin/interpret-lm

最佳短论文

论文：Topic-Regularized Authorship Representation Learning

作者：Jitkapat Sawatphol、Nonthakit Chaiwong、Can Udomcharoenchaikit、Sarana Nutanong
机构：泰国 VISTEC 科学技术研究所

论文摘要：在这项研究中，研究者提出了 Authorship Representation Regularization，一个可以提高交叉主题性能的蒸馏框架，也可以处理未见过的 author。这种方法可以应用于任何 authorship 表征模型。实验结果显示，在交叉主题设置中，4/6 的性能得到了提升。同时，研究者分析表明，在具有大量主题的数据集中，跨主题设置的训练分片存在主题信息泄露问题，从而削弱了其评估跨主题属性的能力。

最佳 Demo 论文

论文：Evaluate & Evaluation on the Hub: Better Best Practices for Data and Model Measurements

作者：Leandro von Werra, Lewis Tunstall, Abhishek Thakur, Alexandra Sasha Luccioni 等
机构：Hugging Face
论文链接：https://arxiv.org/pdf/2210.01970.pdf

论文摘要：评估是机器学习 (ML) 的关键部分，该研究在 Hub 上引入了 Evaluate 和 Evaluation——一组有助于评估 ML 中的模型和数据集的工具。Evaluate 是一个库，用于比较不同的模型和数据集，支持各种指标。Evaluate 库旨在支持评估的可复现性、记录评估过程，并扩大评估范围以涵盖模型性能的更多方面。它包括针对各种领域和场景的 50 多个高效规范实现、交互式文档，并可轻松共享实现和评估结果。

项目地址：https://github.com/huggingface/evaluate

此外，研究者还推出了 Evaluation on the Hub，该平台可以在 Hugging Face Hub 上免费对超过 75000 个模型和 11000 个数据集进行大规模评估，只需单击一个按钮即可。


声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/Gausst松鼠会/article/detail/583865
推荐阅读
article【最全】PS各个版本下载安装及小试牛刀教程（PhotoShop CS3 ~~ PhotoShop 2...
笔者在进行网页开发过程中需要绘制登录页，一般的登录页就是纯色背景加上用户密码输入框，如果想要复杂且页内元素统一的就需要创...
                                    赞
踩
article2022 5月软件测试面试真题汇总，含了 16 个技术栈，已助我成功拿到腾讯 offer_testg...
入职已经一个多月，整体工作环境还是非常满意的！所以这次特意抽空写出了这份面试题，我把它分享给小伙伴们，面试&入职的经验！...
                                    赞
踩
articleVisual Studio 2022 更改背景图片_visual studio设置imagebase...
5.下载好之后，会出现一个提示窗口，要重启VS（手动关掉再打开），这样就可以在设置里找到ClaudiaIDE,点击工具-...
                                    赞
踩
articleAAAI 2022 放榜！旷视研究院 7 篇接收论文亮点解读！...
国际人工智能顶级会议 AAAI 2022（Association for the Advance of Artifici...
                                    赞
踩
article合泰32笔记2-GPIO使用（2022/2/20）_合泰ht32...
HT-GPIO使用1.依赖库的位置如上图：合泰的库文件的头文件在文件夹外部，且是5个上级目录的子文件内，所以，移植时注意...
                                    赞
踩
articleHT32笔记3-UART&USART（2022/2/20）_ht32硬件spi...
HT-UART库使用1.硬件连接如下图		所以，如果我们要使用上端的PA4，PA5去连接MCU的串口USART1的话，...
                                    赞
踩
article《数据中心白皮书 2022》“东数西算”下数据中心高性能计算的六大趋势八大技术_东数西算关键技术白皮...
东数西算| 数据中心|高性能计算算力中心| 低碳节能| GPU服务器在数字经济时代下，算力正在逐渐成为新的生产力，广泛应...
                                    赞
踩
article2022年4月国产数据库大事记_国产数据库 2022...
本文为墨天轮社区整理的2022年4月国产数据库大事件和重要产品发布消息。_国产数据库 2022国产数据库 2022   ...
                                    赞
踩
articleECCV 2022 | 上交&华为提出SdAE：自蒸馏掩码自编码器...
点击下方卡片，关注“CVer”公众号AI/CV重磅干货，第一时间送达作者：鹦鹉丛中笑 |已授权转载（源：知乎）编辑：CV...
                                    赞
踩
article【异常检测-论文阅读】（CVPR 2022）Self-Supervised Predictive C...
引入了一种新的神经块SSPCAB（Self-Supervised Predictive Convolutional At...
                                    赞
踩
article【Web】HNCTF 2022 题解(全)...
过滤了php . log flag :，选择打临时session文件包含。base64解码后读到Rea1web3he11...
                                    赞
踩
articleCVE-2023-38408漏洞修复 - 升级openssl和openssh_cve-2022-43...
CVE-2023-38408 漏洞是OpenSSH 代码问题漏洞修复，升级openssl和openssh_cve-202...
                                    赞
踩
article2022 年最佳 15 款网络监控工具_电脑流量监控软件...
随着过去几十年企业网络的兴起，以及近年来随着虚拟、云和边缘网络的增加，监控工具已经显得越来越重要。在当今大多数企业中，监...
                                    赞
踩
articleminio最新版本(2022.10.31)简易集群搭建（详细到爆）...
解决minio集群搭建问题_minio最新版本minio最新版本                            ...
                                    赞
踩
article2022 年 JavaScript 开发工具的生态，你用的过时了吗？...
JS 工具领域的变化实在太快????。本文将自底向上地从「编译器」、「打包器」、「包管理器」、「第三方库开发」、「Web...
                                    赞
踩
articleKali Linux 2022.3部署指南 VirtualBox快速安装及nmap使用说明_kali...
Nmap（也就是Network Mapper，最早是Linux下的网络扫描和嗅探工具包）是一个网络连接端扫描软件，用来扫...
                                    赞
踩
articleoffice CVE-2022-30190 RCE 复现_cve-2022-30190复现...
简介:当用户点击word等应用程序时，会使用URL协议调用MSDT,随即启动msdt.exe程序造成远程代码执行漏洞。简...
                                    赞
踩
articleCVE-2022-30190:Microsoft office MSDT 代码执行漏洞_cve-20...
该漏洞首次发现在2022 年 5 月 27 日，由白俄罗斯的一个 IP 地址上传。恶意文档从 Word 远程模板功能从远...
                                    赞
踩
article漏洞复现：通过CVE-2022-30190上线CS_30190免杀...
漏洞复现_30190免杀30190免杀                             免责声明：本文章仅供学习...
                                    赞
踩
articleCVE-2022-30190 Follina Office RCE分析【附自定义word钓鱼模板PO...
昨天看了下’Follina’ MS-MSDT n-day Microsoft Office RCE 这个漏洞，修改了下c...
                                    赞
踩
相关标签
photoshop
ui
原型
软件测试
测试工程师
功能测试
自动化测试
面试
visual studio
windows
microsoft
算法
人工智能
python
计算机视觉
机器学习
单片机
嵌入式硬件
物联网
p2p
云计算
数据库
database
mysql