当前位置:   article > 正文

cs224w笔记(p1-p4)

cs224w笔记(p1-p4)

        视频b站:1.1 - Why Graphs字幕版gamma_哔哩哔哩_bilibili

        p4前是数据结构基本内容主要涉及图的基本知识(略)。下面是未在考研数据结构范围内的知识。

        节点中心性是图论和网络分析中用来衡量图中节点重要性的一个概念。  包括:度中心性(Degree Centrality)、接近中心度(Closeness Centrality)  、中介中心度(Betweenness Centrality)、特征向量中心性(Eigenvector Centrality)、PageRank、Katz 指数、信息中心性(Information Centrality)。

        之所以创建这个的意义:下图中c和e的度都是3,若直接以度创建简单的机器学习的话则区分不了c和e的区别  ,所以提出节点中心性这个概念。

        特征向量中心性(Eigenvector Centrality)是一种衡量节点重要性的指标。它基于这样一个理念:一个节点的重要性不仅取决于它直接连接的节点数量,还取决于它所连接的节点的重要性。这种中心性考虑了网络中的间接影响。

白话:意思是你这个点的重要度关键是看和你相连点的重要度,链接你的点越重要你就越重要。

        介数中心性(Betweenness Centrality)是衡量一个节点在网络中作为其他节点之间路径的桥梁的频率的指标。它反映了一个节点在网络中控制信息流动的能力。在社交网络、交通网络、供应链等多种类型的网络中,介数中心性都是一个重要的中心性度量。

白话:如果这个点于其他节点直接的路径大多数都是最短的,那么他就是重要节点。(视频原话)。

所以根据上图例子我们可以计算出节点中介中心度:1/(一个点到其余个点的条数之和)

接近中心度:是衡量一个节点在网络中相对于其他所有节点的平均接近程度的指标。它反映了一个节点在网络中传播信息或影响其他节点的能力。接近中心性越高,意味着该节点到其他所有节点的平均距离越短,因此它在网络中的位置越中心。

白话:如果一个节点到其余各点的最短的路径和是最短的,那么他是最重要的。所以你越中心就越重要。

        聚类系数(Clustering Coefficient)是衡量网络中节点聚集程度的指标。它反映了网络中节点的局部连接结构,即一个节点的邻居节点之间相互连接的程度。聚类系数越高,说明网络中的节点更倾向于形成紧密的群组或社区。

白话:描述的是一个节点于周围节点之间的连接程度。

举例:第一个图的计算是6/(C下底4上底2)=1。6是周围四个点之间的连结个数,下底4是V节点周围有4个点,上底2是固定写法。这个公式的解释是,分子表示实际上周围点的连接数量,分母是理论上最多的连接数量。

        同时也可以计算三角形有多少个,三角形的数量就是分子的大小。

        图元(Graphlets)是图数据挖掘和生物信息学中用来描述图中局部结构模式的术语。图元是小的、固定的图结构,通常由少量的节点和边组成,它们在较大的图中频繁出现。通过识别和分析这些小的图结构,可以更好地理解复杂网络的局部特性和全局特性。

        图元度向量(Graphlet Degree Vector,简称 GDV)是一种在图数据挖掘中用来描述图中局部结构特征的向量。它基于图元(Graphlets)的概念,通过统计图中每个节点参与的图元类型和数量,来捕捉节点的局部连接模式。

个人理解:首先有G图抽取出来的图元有以上3个,其次在这3个图元中不出现同构的位置有a,b,c,d,,然后将abcd依次放入v位置得出的具有不重复的表示有a->2种,b->1种,c->0种,d->2种。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/寸_铁/article/detail/869086
推荐阅读
相关标签
  

闽ICP备14008679号