赞
踩
让计算机理解人类语言,图灵测试就是基于对话的方式。
怎么表示词义呢?
根据前文预测下一个词是什么,接龙。
需要的能力:1. 计算词的序列成为一句话的概率,即联合概率;2. 根据上文预测下一个词是什么
如何完成?
基本的假设:假设一个未来的词只会受前面的词的影响(马尔可夫性)。可以将联合概率拆解为条件概率相乘
看前面出现了几个词对后面词的频度
4-gram:前面出现了3个词对下一个词的频度。统计学的模型
Bigram:只考虑前面一个词,N=2
Trigram:只考虑前面2个词,N=3
存在问题:基于符号的统计问题:统计结果稀疏,数据量巨大;不能理解词之间的相似度dog-cat
首先把词表示为低维的向量;再将前几个词的向量拼接在一起;用向量来预测后面的词。
相似的词,向量也会比较相似
预训练模型为何重要?
为什么work?
实例:GPT-3 (175B)、DALL-E 2 (5B)
服务器:3090 200h
需要的知识:SSH Vim Tmux …
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。