赞
踩
fastText的核心思想:将整篇文档的词及n-gram向量叠加平均得到文档向量,然后使用文档向量做softmax多分类。这中间涉及到两个技巧:字符级n-gram特征的引入以及分层Softmax分类。
模型结构跟word2vec里的CBOW结构一样, 只不过输出结果由预测词变为了预测类别.
模型的优