当前位置:   article > 正文

Paper Reading: STS-B_sts-b数据集

sts-b数据集

Paper Reading: STS-B

1. 引言

论文全名为:SemEval-2017 Task 1: Semantic Textual Similarity Multilingual and Cross-lingual Focused Evaluation

STS是什么?Semantic Textual Similarity (STS) ,用来表示句子意义的相似性。

主要有哪些应用呢?包括机器翻译(machine translation, MT),总结归纳(summarization),生成(generation),
问答(question answering, QA) ,答案评分(short answer grading),语义搜索(semantic research),
对话系统(diaglog and conversational systems)

2. 数据库的相似性分数

分数等级评分标准示例一示例二
5这两个句子是完全等价的,意思是一样的The bird is bathing in the sink.Birdie is washing itself in the water basin.
4这两个句子大部分是等价的,但有些不重要的细节不同Two boys on a couch are playing video games.Two boys are playing a video game.
3这两个句子大致相等,但是有些重要信息不同/缺失John said he is considered a witness but not a suspect.“He is not a suspect anymore.” John said.
2这两个句子不相等,但是有一些共同的部分.They flew out of the nest in groups.They flew into the nest together.
1这两个句子不是等价的,而是在同一个主题上。The woman is playing the violin.The young lady enjoys listening to the guitar.
0两句话完全不一样。The black dog is running through the snow.A race car driver is driving his car through the mud.

其实到这,LZ阅读这篇论文的目的已经达到了,因为现在有个任务,LZ考虑用中文的相似度来做这件事情,
目前的难点是:数据集的制作和label即这个相似度怎么评判的,这个还要考虑一下,这篇paper的评判标准可以作为参考,但可能实际应用还得针对对应的需求来做调整。

PS:最近真的好多反社会的事情,大连的宝马车撞人,南京新街口的撞人捅人,不知道明天和意外哪个先来,生活不易,珍惜每一天吧!

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/正经夜光杯/article/detail/850546
推荐阅读
相关标签
  

闽ICP备14008679号