当前位置:   article > 正文

# 研究杂感 × 改进文本共现分析 PMI-Gephi(第二辑)_共现文本分析实例

共现文本分析实例

写在前面

单纯用一个普通的Gephi逼格还不够高,继续尝试一下其进阶版——PMI-Gephi 进行改进文本共现分析

理论介绍

在这里插入图片描述
其中,分子是两个词语共同出现的概率,分母是两个词语分别出现的概率的乘积

在数学中,我们认为,理论上分子等于分母:
在这里插入图片描述
分子中的P(W1,W2) ,它指的是这两个词语在语料中的实际贡献概率
分母中的P(W1) 和 P(W2) ,它指的是两个词语实际出现的概率
在这里插入图片描述

W1 和 W2 的求法相同
在这里,“文档”是一个比较宽泛的概念,比如在我的毕设中即以一条评论作为一个文档

从理论上推导这两个词语共同出现的概率,也就是说分母相当于一个期望值分子是一个实际出现的概率

如果说比值大于1(即实际贡献率>期望值)—该词语的贡献更有意义—网络关系生成
如果说比值小于1(即实际贡献率期望值)—该词语的贡献意义不大—不会生成网络关系

然后其余的方法也是和之前的类似

需要注意的是:
网络边的权重的值和之前的略有不同
之前的权重是根据每一个节点和其他多少节点相连
现在的权重变成了我们计算的PMI值

然后计算一下 平均加权度

在计算权重的时候,要点选 “使用权重” 栏
在这里插入图片描述
渲染时即采用 加权度 进行渲染
在这里插入图片描述
同时标签也采用 加权度 进行渲染
在这里插入图片描述
在布局上,似乎这个算法要运行地快一些↓
在这里插入图片描述
然后再根据自己图像的效果对字号啥的进行修改调整
在这里插入图片描述

总结

大概就是这样啦,接下来就在毕设中尝试应用叭~

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/菜鸟追梦旅行/article/detail/239087
推荐阅读
相关标签
  

闽ICP备14008679号