当前位置：首页 > news >正文

RippleNet: Propagating User Preferences on the Knowledge Graph for Recommender Systems

news 2025/10/4 20:05:07

多关系压缩: 一个物品与其他实体通过多种关系相连（类别、品牌、属性、制作人…），嵌入把多语义压缩到固定维度，很难保留清晰、可分解的“哪一种关系导致相似”的解释。
路径可组合性弱: 多跳路径蕴含的组合语义（如“同导演→同题材→同受众”）在简单向量运算中难以保真，导致复杂关联被“糊成”相近但不可解释的距离。
语境依赖丢失: 项目相关性常常依用户/场景而变（同一两物品对不同用户意义不同）。静态嵌入用统一相似度度量（点积/余弦）难以表达这种条件化关系。
目标不一致: KG嵌入多以链路预测为目标，优化“真假三元组可分性”，而推荐需要用户偏好排序与业务可解释性，二者并不等价。
长尾与稀疏: 关系少或冷门物品学到的向量不稳定，近邻关系受噪声主导，难以形成可靠的“项目-项目”语义。
可解释性受限: 高维向量接近并不直接对应可读的关系句子或具体路径，难以给出“为什么这两个项目相关”的直观依据。

在异构信息网络/知识图谱中，用“节点类型→关系类型”的序列定义的一种语义路径模板，描述两类实体之间的关系模式，而非具体数据上的一条边。例如：用户-评分->电影-由->导演-执导->电影（记作 U-R-M-D-M），表示“用户通过共同导演关联到另一部电影”的语义。

选路径: 依据业务先验或自动搜索，挑选能表达偏好的元路径（如 U-M-U 共同喜好、U-M-A-M 同演员、U-M-T-M 同标签）。
算关联分数: 对每个用户-物品对，在每条元路径下计算“可达性/相似性”作为特征 f_k(u,i)。常见做法：
- 路径计数: 统计从 u 到 i 的元路径实例条数（可加衰减或去重）。
- 路径约束随机游走（PCRW）: 只沿元路径类型行走，取从 u 抵达 i 的概率。
- PathSim/HeteSim: 对称路径用 PathSim 比同类节点相似度，异类对（如用户-物品）用 HeteSim 的归一化可达性。
矩阵乘法实现: 为每种关系建邻接矩阵 A_R；某元路径 R1→R2→…→RL 的连通强度可由 M = A_R1 · A_R2 · … · A_RL得到，M[u,i] 即 f_k(u,i) 的原始值（再做归一化/平滑）。
融合与排序:
- 无监督: 设权重 w_k，得分 s(u,i) = Σ kw_kf_k(u,i)，w_k可靠验证集调参或启发式设定。
- 监督学习: 把各 f_k 作为特征，喂给 LR/FM/GBDT/神经网络，直接学习点击/评分/转化；或做 pairwise 排序优化 NDCG/HR。
生成Top-N: 对每个用户按 s(u,i) 排序，输出前N个物品，并可附上触发的元路径实例做可解释性说明。