【斯坦福cs224w-图机器学习】7-Graph-Representation-Learning

GNN

发布日期: 2020-11-25

无监督学习方法——Node Embedding

	原始网络	嵌入空间
度量标准	$similarity(u,v)$	$z_{v}^{T}z_{u}$

Embedding-lookup

其实就是一个哈希表，key为节点，value为节点的embedding。

今天的课程都是这种look-up性质的Embedding，它是静态的，在之后的downstream任务中是不会改变的。

Step 1：定义Similarity

Random Walk Approaches to Node Embedding

本小节讲解的是下面两篇论文：

Perozzi et al. 2014. DeepWalk: Online Learning of Social Representations. KDD.

Grover et al. 2016. node2vec: Scalable Feature Learning for Networks. KDD.

Random Walk

random walk是一个名词，它是图上的一个节点序列；
random walk的长度是一个自定义的参数，需要根据不同的应用场景进行选择；

你可能会想，我明明在学习Node Embedding，为什么要给我讲Random Walk呢？难道Random Walk可以帮助我们来设计学习Node Embedding的算法？

修改random walk的类型，那么我们就能定义不同的相似性，比如neighborhood，structural role等等。

基于random-walk的embedding的思想是：

为什么固定为dot product为$cos(\theta)$呢？

因为概率的大小是介于[0,1]之间的。

选择random walks作为similarity的原因

表达性：采用不同的random walk机制，能够获取到局部和全局的信息。
高效性：Node Embedding算法要优化是$z_{v}^{T}z_{u}$，如果考虑所有的$(src，dst)$对，那么计算量将会是巨大的。在random walk中，我们只考虑出现在同一random walk中的$(v,u)$对，这无疑减少了计算量。（Scalable）

这一点在图变得越来越大的时候，尤其的重要！

对于基于Random Walk的Node Embedding算法来说，random walk的采集策略是非常重要的，可以说绝大部分的算法都是在对这个策略进行创新。不同的策略将会产生不同的$N_{R}(u)$。

这个式子有点极大似然估计的味道；

==为什么要使用Log-likelihood作为目标函数？==

对于概率$P(N_R(u)|z_u)$，我们知道它是一个介于[0,1]之间的数字，是非常小的。老师说小的数字将会在训练过程中引发numerical instability；

而且，使用它并不会改变我们的直观感受。