当前位置:   article > 正文

CiteSpace学习笔记(九)——数据分析与结果解读_citespace聚类结果的解读

citespace聚类结果的解读

一、数据分析关键步骤
1、运用尽可能广泛的专业术语来确定所关注的知识领域。这是为了所得到的结果尽可能地涵盖所关注领域的全部内容。该步骤要求用户对自己所关注的领域比较熟悉。在此前提下用户才能确定出合理的术语,以及需要重点关注的术语问题。
2、收集数据。在上一步确定好要检索的术语以后,接下来则要选择数据库来获取所要分析的 数据。当前CiteSpace所分析的数据类型基础是Web of Science格式,从Web of Science中下载的数据,CiteSpace可以直接读取和分析,从其他数据库所收集的数据则要通过转换器进行格式转换才能进行分析。该步骤对用户的信息检索素质要求比较高。因此,具备一定的信息检索技能以及检索技巧是必须的。
3、提取研究前沿术语。从数据库文献的题目、摘要、关键词、系索词和表示符中检索N元文法或专业术语,出现频次增长率快速增加的专业术语将被确定为研究前言术语。
4、时区分割。在CiteSpace中需要明确要分析的时间跨度以及这个时间跨度的分段长度。
5、阈值的选择。CiteSpace允许用户使用7种方法来设定阈值。
6、网络精简和合并。在CiteSpace中提供两种网络精简算法,分别为Pathfinder和MST。在对数据进行初始分析时,一般不做任何精简。通过初步得到的结果,再决定采用何种精简方法。
7、可视化显示。CiteSpace的标准视图(默认)为网络视图,此外还有Timeline(时间线图)和Timezone(时区图)视图。
8、可视化编辑和检测。得到图谱之后借助CiteSpace可视化界面提供的网络可视化编辑功能美化图形,也可以利用提供的网络计算功能对网络进一步分析。
9、分析结果的验证。使用CiteSpace得到分析结果后需要与熟悉本专业学者、专家进行沟通。特别地,建议对网络中突出的关键节点的作用进行咨询。
二、分析结果的解读
CiteSpace的核心功能是产生由多个文献共被引网络组合而成的一种独特的共被引网络,以及自动生成的一些相关分析结果。每个文献共被引网络对应于一个历时一年或几年的时间段。最终显示的网络不是各个网络之间的简单叠加,而是要满足一些条件。解读这样的递进式知识领域分析的要点包括:网络整体结构、网络聚类、各聚类之间的关联、关键节点(转折点)和路径。解读时可以从直观显示入手,然后再参照各项指标。
1、结构。是否能看到自然聚类(未经聚类算法而能直观判定的组合),观察通过算法能得到几个聚类,是否包括一些重要的节点,如转折点(Pivot node,再CiteSpace中为有紫色外圈的节点,是具有高的中介中心性的节点)、标志点(Landmark node,如每个节点大小代表它的总被引次数,节点越大则总被引频次越高)和具有高的度中心性的点的(Hub node,枢纽节点,具有高的度中心性)。
在这里插入图片描述
2、时间。每个自然聚类是否有主导颜色(出现时间相对集中),是否有明显的热点(节点年轮中出现红色年轮,即被引频率是否曾经或仍在急速增加),通过各个年轮的色彩可判断被引时间分布。时间线显示将每一聚类按时间顺序排列,相邻聚类常常对应相关主题(聚类间共引)。聚类之间的知识流向也可从时间(色彩)上看到(由冷色到暖色)。
3、内容。每个聚类的影响(被引时涉及到的主题,摘要,关键词)和几种不同算法所选出的最有代表性的名词短语。
4、指标。每个聚类是否具有足够的相似性(Silhouette值是否足够大,太小则无明确主题可言),整个聚类是否有足够节点。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/不正经/article/detail/511747
推荐阅读
相关标签
  

闽ICP备14008679号