赞
踩
作者:AlanLauPython爱好者社区专栏作者
图中每个节点代表一个角色,节点与节点之间的连线代表共现,而连线的粗细表示共现的频次多少。节点的大小以及颜色深浅表示度的大小,即一个角色参与共现的总频次。
现在说说这张图的实现步骤:
1.对挖掘获取的语料进行角色抽取
2.对出现同一章节的角色进行合并
3.使用步骤2中的数据进行共现矩阵计算
4.利用UCINET、NETDRAW、Gephi对共现矩阵实现可视化。
1.对挖掘获取的语料进行角色抽取
先前原本使用的是jieba和nlpir两种自然语言处理包进行角色抽取的,但是后面发现效果特别差,所有后面则从百度百科上档了一批角色列表下来,那这个与原文本进行比对,实现角色的抽取。
2.对出现同一章节的角色进行合并
写爬虫的时候就实现一边爬一边对角色进行抽取。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。