赞
踩
因为BERT接受的输入和BiLSTM以及TextCNN不太一样,所以我们不能沿用之前的数据预处理方式。
事实上,我们只需对原先的序列在其开头加上 <cls> 词元,在其结尾加上 <sep> 词元,然后进行填充(注意是先添加特殊词元再进行填充)。于是 build_dataset() 重写为
<cls>
<sep>
build_dataset()
def build_dataset