NLP模型BERT和经典数据集！

作者：凡人多烦事01 | 2024-04-24 15:24:25

踩

bert模型适用数据集

↑↑↑关注后"星标"Datawhale

每日干货 & 每月组队学习，不错过

Datawhale干货

作者：陈安东，中央民族大学，Datawhale成员

对于刚入门NLP的伙伴来说，看到NLP任务很容易觉得眼花缭乱，找不到切入点。总的来说，NLP分为五大类无数小类，虽然种类繁多，却环环相扣。无论我们一开始学习的是什么方向，当做过的东西越来越多，学习范围越来越大的时候，总可以形成闭环。

这一次，我们从教机器做阅读理解题起航，介绍用火到“出圈”的Bert和常见数据集入手NLP的整体流程。

NLP五大类别

什么是机器阅读理解？形式就像下图：

答案是机器做出的

怎么样，是不是感觉很酷！让我们的模型来做阅读理解题目，好似机器有了人类理解的能力。当然，也不能太乐观，现在机器阅读理解任务还在逐步探索阶段。在训练方式上，对于不同机器阅读理解数据集，就会有对这个任务的不同解法。对于机器阅读理解任务，我们将其分为三个类型。难度逐步上升：

可以看出，如果答案在文章内可以清晰的找到，那么模型就不需要生成答案，只需要将答案抽取出来就好了，这样的任务是简单的，可以使用SQuAD 1.0学习。

更近一步，有些阅读理解的问题中是没有答案的，正确的答案就是不回答，这种行为更接近智能，任务也变的更困难，需要用SQuAD 2.0学习。

此外还有对话系统，它的答案要和实

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/凡人多烦事01/article/detail/480044