当前位置:   article > 正文

PubMedQA生物医学研究问题解答数据集(2019)下载

pubmedqa

PubMedQA是从PubMed摘要中收集的新颖的生物医学问答(QA)数据集。PubMedQA的任务是使用相应的摘要以是/否/可能的方式回答研究问题(例如:术前他汀类药物是否能减少冠状动脉搭桥术后的房颤?)。

PubMedQA具有1k专家注释,61.2k未标记和211.3k人工生成的QA实例。每个PubMedQA实例均由

(1)一个问题(既可以是现有研究文章的标题,又可以是从其中得出的问题)组成;
(2)上下文是没有其结论的相应摘要;
(3)长答案,即摘要,大概可以回答研究问题;
(4)是/否/也许是答案,总结了结论。

PubMedQA是第一个QA数据集,需要对生物医学研究文本进行推理,尤其是其定量内容才能回答问题。我们性能最佳的模型是BioBERT的多阶段微调,具有长答案词袋统计作为额外的监督,可实现68.1%的准确性,相比之下,单个人的性能为78.0%的准确性和多数基准为55.2%的准确性,有很大的改进空间。

作者: Qiao Jin, Xinghua Lu

备注:EMNLP 2019

论文:https://arxiv.org/abs/1909.06146

官网:https://pubmedqa.github.io/

官方下载

https://github.com/pubmedqa/pubmedqa

百度网盘

链接: https://pan.baidu.com/s/1P5oIbyq3p6er71v3DFRFxg 提取码: 47y7

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/很楠不爱3/article/detail/666789
推荐阅读
相关标签
  

闽ICP备14008679号