最近看了些图神经网络方面的论文,发现这几年这方面的文章虽然很多,但是各类方法在几个benchmark数据集上的准确率并没有很明显的提升。看了10来篇论文后,找了一个实现相对简单,性能还算可以的方法介绍给大家

之前写过几篇关于图神经网络的论文解析和复现
DeepLearning | 图注意力网络Graph Attention Network(GAT)论文、模型、代码解析DeepLearning | 图卷积神经网络(GCN)解析(论文、算法、代码)

今天介绍的是2020年ICLR最新的论文
Topological Based Classification using Graph Convolutional Networks

恰好,这篇论文里的方法是基于GCN和GAT来进行实验的,所以感兴趣的朋友不妨先去看看之前的两篇博客


目录

  • 一、摘要
  • 二、方法
  • 三、实验
  • 四、 更多资源下载


一、摘要

在图模型中,通常认为节点的类别与它们的近邻节点的类别相关联。这里,我们提出节点的类别也与节点的拓扑结构特征相关联。利用这一关联性,我们提升了图机器学习模型的性能,特别的,以图卷机网络(GCN)和图注意力网络(GAT)为例。

首先,我们表明,即使在节点上没有任何外部信息的情况下使用以下两种方法可以在预测节点类时获得良好的精度:1.使用拓扑结构特征,2.使用邻居节点的标签。这种准确性略小于使用基于内容的GCN可以获得的值。其次,我们证明显式地将拓扑特征作为输入添加到GCN中与节点上的外部信息结合时,不会提高准确性。但是,添加一个基于拓扑特征的邻接矩阵可以显著提高模型精度,在多个数据集中获得优于所有最新方法的结果。

二、方法

首先我们说明文章的贡献点

  1. 提出了基于拓扑特征的GCN(T-GCN)。我们构造了两个邻接矩阵,第一个邻接矩阵是通常意义上基于节点特征构造的,而第二张图是基于图的拓扑结构特征构造的。两张图的节点数量相同,不同点在于拓扑结构图的节点特征描述了该节点的拓扑属性。拓扑属性包含很多种,比如近邻数量等。通过拓扑属性的相似度来构造拓扑结构图的连接关系,这一点其实和第一张图也是相似的,只是节点的描述内容变了
  2. 提出了基于拓扑特征的GAT(T-GAT)。与T-GCN相似,只是卷积层由普通的卷积换成了注意力卷积。这也说明了提出的拓扑特征的普适性能。

文章还尝试了对拓扑特征的其他一些运用,如将拓扑特征和普通特征连接输入等,但这些方法并没有在实验中表现出突出性能,因此,这里就不多做描述了。

拓扑结构特征包含的属性有以下内容:

  1. 度: 边的进出(在有向图的情况下)数
  2. 中间性:中间性是中心度的度量,定义为从其它所有顶点到该顶点最短路径的数量
  3. 紧密型:紧密型也是中心度的度量,定义为该顶点到其他顶点最短路径的平均长度
  4. 距离分布:我们使用Djekstra算法计算从每一个节点到其他节点的距离分布,然后使用该分布的一阶和二阶量
  5. 流量:我们将节点的流量定义为节点与所有其他节点之间的无向和有向距离之比。
  6. 吸引力:吸引力是“从每个顶点可以到达的网络的加权分数”与“可到达顶点的网络的加权分数” 的比较
  7. 频率:对于每个节点,我们计算该节点参与的每个模体的频率
  8. K-核:K-核是一个极大子图,它包含K次或更多的顶点。等价地,它是由删除度小于k的所有节点
  9. Louvain社区检测算法。Louvain算法是一种社区检测算法。该算法通过模块化的优化工作,刻度值在-1到1之间

上述的每一种属性,都有相应的论文进行详细的论述和讨论,具体见论文参考文献

文章提出的模型结构如下:

图卷积神经网络图像修复论文 图卷积神经网络实战_图卷积神经网络图像修复论文


很清楚的,可以看出,文章模型的变化只是在第一层多了一个图卷积层,而该卷积层使用的是使用拓扑属性构造的邻接矩阵。

三、实验

数据集是几个图网络方面标准的数据集

图卷积神经网络图像修复论文 图卷积神经网络实战_拓扑结果_02


模型参数

图卷积神经网络图像修复论文 图卷积神经网络实战_T-GCN_03


实验结果

图卷积神经网络图像修复论文 图卷积神经网络实战_图卷积网络_04


可以看出,在使用了拓扑属性特征以后,GCN在Citeseer数据集上,模型准确率提升了近3%。

图卷积神经网络图像修复论文 图卷积神经网络实战_GCN_05


这里是几种对拓扑特征不同用法的对比,可以发现T-GCN总是比传统的GCN要好。