特点 与传统方法估算 P ( w i ∣ w i − ( n − 1 ) , ⋯   , w i − 1 ) P\left( {
{w_i}\left| {
{w_{i - \left( {n - 1} \right)}}, \cdots ,{w_{i - 1}}} \right.} \right) P(wi∣∣wi−(n−1),⋯,wi−1)不同,NNLM直接通过一个神经网络结构对 n n n元条件概率进行估计。
基本结构
大致操作 从语料库中搜集一系列长度为 n n n的文本序列 w i − ( n − 1 ) , ⋯   , w i − 1 , w i {
{w_{i - \left( {n - 1} \right)}}, \cdots ,{w_{i - 1}},{w_i}} wi−(n−1),⋯,wi−1,wi,假设这些长度为 n n n的文本序列组成的集合为 D D D,那么NNLM的目标函数为: ∑ D P ( w i ∣ w i − ( n − 1 ) , ⋯   , w i − 1 ) \sum\nolimits_D {P\left( {
{w_i}\left| {
{w_{i - \left( {n - 1} \right)}}, \cdots ,{w_{i - 1}}} \right.} \right)} ∑DP(wi∣∣wi−(n−1),⋯,wi−1<