赞
踩
学习目标
• 了解自然语言处理基本知识
• 掌握循环神经网络算法
• 掌握自然语言处理关键技术
• 了解自然语言处理的应用
什么是文本向量化
• 文本向量化:将文本表示成一系列能够表达文本语义的向量。常用的向量化算法有:
• one-hot
• TF-IDF
• word2vec
o CBOW模型
o Skip-gram模型
• doc2vec/str2vec
o DM(Distributed Memory)
o DBOW(Distributed Bag of Words)
• 文本表示是自然语言处理中的基础工作,文本表示的好坏直接影响到整个自然语言处理系统的性能。文本向量化是文本表示的一种重要方式。无论是中文还是英文,词语都是表达语义的基本单元。
用四个维度(向量)表示这几个对象。
word2vec - CBOW模型
用中间词
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。