赞
踩
经典NLP的一般方法 传统的特征工程技术:
1)词袋:根据词频创建特征表示。 缺陷:没有保留单词顺序,丢失上下文信息。 2)n-gram:它将文本分解为由n个字母(单词)组成的较小元素,字母级别表示的优点是在大型语料库上词汇量小得多 语言建模任务的经典方法: 传统方法的缺点: