利用大语言模型构建常识图谱增强推荐

原创

用户11764306

发布于 2026-06-05 18:06:16

构建常识知识图谱以辅助产品推荐

利用大语言模型辨别常识关系，可将下游任务性能提升高达60%。

作者：Changlong Yu, Zheng Li，2024年5月10日，阅读时间5分钟

会议

SIGMOD/PODS 2024

COSMO

COSMO的知识图谱构建过程从两类数据开始：查询-购买对（将查询与固定时间或点击次数内的购买相结合）和共同购买对（将同一购物会话中的购买相结合）。对数据集进行初步剪除以减少噪音——例如，移除购买产品类别在平台产品图谱中相距过远的共同购买对。

然后将数据对输入LLM，要求其使用四种关系之一描述输入之间的关系：usedFor, capableOf, isA, cause。从结果中筛选出一组更细粒度的频繁出现的关系，并使用规范形式进行编码，如 used_for_function, used_for_event, used_for_audience。然后重复该过程，要求LLM使用新的、更大的关系集来构建描述。

LLM在执行此类任务时倾向于生成空洞的理由，例如“客户把它们放在一起购买是因为他们喜欢它们”。因此，在LLM生成一组候选关系后，应用各种启发式方法进行筛选。例如，如果LLM对问题的回答在语义上与问题本身过于相似，则过滤掉该问答对，假设LLM只是在转述问题。

从通过过滤过程的候选项中，选择一个有代表性的子集，发送给人工标注员根据两个标准进行评估：合理性（推断的关系是否合理）和典型性（目标产品是否通常与查询或源产品相关联）。

使用标注数据训练一个基于机器学习的分类器，为其余候选者分配合理性和典型性分数，只保留超过特定阈值的候选者。从这些候选项中提取语法和语义关系，这些关系可以编码为对LLM的指令，例如“使用 capableOf 关系为领域d中的搜索-购买行为生成解释”。然后使用适用的指令提示LLM，重新评估所有候选对。

结果是一组实体-关系-实体三元组，例如 <相机壳和屏幕保护膜的共同购买， capableOf，保护相机>，从中构建知识图谱。

评估与应用

实验中使用的双编码器模型有两个独立的编码器，一个用于客户查询，一个用于产品。两个编码器的输出被连接起来并馈送到一个神经网络模块，该模块产生相关性分数。

在交叉编码器中，查询和产品描述的所有相关特征都传递给同一个编码器。通常，交叉编码器比双编码器工作得更好，因此使用这种架构来测试COSMO数据的有效性。

在第一阶段实验（编码器冻结）中，基线模型接收查询-产品对；第二个交叉编码器接收查询-产品对以及COSMO知识图谱中的相关三元组，例如 <相机壳和屏幕保护膜的共同购买， capableOf，保护相机>。在这种情况下，基于COSMO的模型在两个F1指标上均显著优于交叉编码器基线，而交叉编码器基线又优于双编码器基线。

在第二阶段实验中，对基线模型在Shopping Queries数据集的子集上进行微调，并对第二个交叉编码器在同一子集和COSMO数据上进行微调。所有三个模型的性能都大幅提升，但基于COSMO的模型在两个F1指标上仍保持超过20%的优势。

研究领域

搜索与信息检索

会议

SIGMOD/PODS 2024