并非所有数据都是文本或图像。社交网络、分子结构、推荐系统、欺诈检测网络和物流路线都是天然的图结构。当实体之间的关系与实体本身同样重要时,GNN 是正确的工具。药物发现、社交网络分析和交通预测都依赖于 GNN。
GNN 的核心操作是消息传递:每个节点从其邻居收集信息,聚合它(求和、平均或注意力加权),并更新自身的表示。经过 K 轮消息传递后,每个节点的表示编码了关于其 K 跳邻域的信息。图卷积网络(GCN)、GraphSAGE 和图注意力网络(GAT)是最常见的架构,它们在聚合邻居信息的方式上有所不同。
药物发现:分子是图(原子 = 节点,化学键 = 边)。GNN 通过从分子图结构中学习来预测分子性质、结合亲和力和毒性。社交网络:GNN 检测社区、预测链接和识别有影响力的节点。推荐系统:用户和物品形成二部图,GNN 根据图结构预测用户会喜欢哪些物品。欺诈检测:交易网络揭示 GNN 可以学习识别的可疑模式。
Transformer 和 GNN 之间存在深层联系:自注意力可以被视为在全连接图上的消息传递(每个 token 关注其他每个 token)。GNN 在稀疏图上操作(每个节点只连接到其实际邻居)。这种联系启发了图 Transformer,将 Transformer 的表达能力与稀疏图结构的效率相结合,并促进了两个社区之间的思想交流。