赞
踩
李宏毅上课的第7个作业,就是微调一个问答系统。给出一段话,回答几个问题,问题的答案都在段落里面。
任务介绍
先前介绍BERT应用的时候,其实已经提了一嘴。整个模型的输入是段落和问题,输出是答案在段落的起止点。
在transformer中,这整个模型其实已经被封装起来了,只需要调用一个BertForQuestionAnswering,就可以获得这整个模型。而每一个预训练好的bert都对应一个tokenizer,就是把句子转换成一个个单独词向量的工具。
准备环境。设置好输入输出工作目录,设置随机数种子,方便复现
设置tokenizer和bert模型的预训练设置
设置Dataset和loader
定义检验结果函数以及训练过程
测试结果输出与保存
其中,本文涉及到的代码只是从样例代码里修改。首先,把sample code适配到我的目录后,准确率达到50.0%。适配过的sample code见此链接。把各自输入输出目录匹配以后,一品丹药就炼好了,因为正确率太低,只要吸收药力就会爆体而亡。
1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用!
2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。
3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。
下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。
添加作者公众号咨询即可
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。