赞
踩
(1)传统:基于规则 (2)现在:基于统计机器学习:HMM,CRF,SVM,LDA,CNN…,规则隐含在模型参数中。
(1)简单 词/短语翻译 向量空间分布的相似性 (2)向量空间子结构
i.无法衡量词向量之间的关系 ii.词表维度随着语料库增长膨胀 iii.n-gram词序列随语料库膨胀更快 vi.数据稀疏问题