微信扫码
与创始人交个朋友
我要投稿
论文标题:PEACE: Prototype lEarning Augmented transferable framework for Cross-domain rEcommendation
组织单位:蚂蚁集团
录用会议:WSDM 2024
论文链接:https://arxiv.org/abs/2312.01916
背景
PEACE-基于原型学习的实体图谱预训练跨域推荐框架
预备知识-基于实体图谱的跨域对齐
模型框架
01
实体导向的预训练模块
诸如支付宝等在线服务平台聚集了来自不同服务提供商提供的各式各样的小程序/场景,通常来说这些场景间信息不互通,没有一套共享的数据体系,因而即使是同一品牌同一类目下的产品的属性也无法完全对齐(如不同小程序中售卖的iPhone 14具有不同的商品ID,类别名称,比如在一个小程序中类别为电子产品,在另外一个小程序中类别为电子)。为了减小由于这些潜在问题带来的差异及其对于建模性能的影响,同时也更好的利用这些交互信息,我们基于实体图谱进行预训练,希望通过这样的方式来引入实体粒度的信息以实现泛化性更强的预训练。为了更好的利用图谱中的拓扑结构信息以对图谱中节点的表征进行增强,我们在实体图谱通过图卷积的方式来得到了图谱中各个实体的维表征。
基于该预测结果,我们可以得到实体导向的预训练模块的损失函数:
02
基于原型对比学习的实体表征增强模块
03
基于原型增强注意力机制的用户表征增强模块
在预训练阶段,源域收集到的数据包含了用户在不同场景的行为,比如在制定旅行计划的时候用户会访问和出行相关的场景,而在需要找工作时会访问和在线求职相关的场景,然而,之前步骤中学习到的用户通用表征未将用户和场景相关的context考虑进来,这使得无法捕捉到在不同场景下的和场景相关的表征,因此我们希望借助于注意力机制来对context进行捕捉从而对用户表征进行增强。
其中旨在找到中第大的值。
由于原型可以作为实体图谱中的聚类中心,我们可以使用最相关的个不同原型来表示场景相关的context,从而捕获在不同场景下的语义信息对用户通用表征的影响。给定用户在任一兴趣下的表征,我们可以通过如下方式来得到对场景有感知的用户表征:
04
模型训练及预测
由于对于目标域的未知的item,我们可以通过映射函数将其映射到不同的实体从而得到需要的表征,因而实体导向的预训练模块使得我们的方法具有很强的泛化性,可以快速的适用于目标域的不同场景。给定目标域,给定user-item对,和的基础特征和以及预训练表征和,我们可以得到对的偏好性分数:
以及最终的损失函数:
在线部署
对于冷启场景,通过直接对user和item的表征做内积,我们可以获取到user对不同item的偏好程度从而直接进行排序;
对于已经累积了一定数据的非冷启场景,我们基于预训练的user/item表征和user/item的基础信息进行微调,然后将微调得到的模型用于在线服务。
效果分析
离线实验
01
数据简介
我们收集了一个月的支付宝账单,足迹,搜索数据作为源域数据,对于目标域,我们在六种类型的小程序,即租赁,旅行,数字藏品,日用百货,美食,食物配送上进行了实验,由于目标域数据相比于源域更为稀疏,我们收集了过去两个月的行为数据用于模型训练。为了对不同域间的巨大差异进行桥接,我们引入了具有千万级节点,百级关系和亿级边的实体图谱。具体的数据情况可参见下表。
02
有效性实验
结合两个表格中的实验结果我们可以发现,整体而言,实验结果表明:
PEACE在冷启/非冷启的场景中相比于基线而言均取得了大幅的提升,这表明了基于实体粒度的预训练和基于原型学习进行增强的机制的结合的有效性;
就大多数情形而言,预训练+微调的模型相比于无预训练的基线DeepFM有较大的提升,这说明了引入多源数据进行预训练的有效性,然而,在一些情形下,部分模型的表现不如基线DeepFM,有一定的负向迁移,而这进一步阐明了预训练方式的重要性;
在许多情形下,基于gnn的跨域推荐模型并没有取得很好的实验效果,这很大程度上是归咎于实体图谱中的巨大噪声,而由于我们在PEACE模型中引入了原型学习,通过聚类的方式使得相似的实体在表征空间中有着相近的距离,而不同的实体间的距离被拉的更远,从而缓解了这些噪声对模型带来的负面影响。
03
消融分析
PEACE w/o GL,即移除实体表征时的图学习模块;
PEACE w/o CPL,即移除基于对比的原型学习模块;
PEACE w/o PEA,即移除基于原型增强的注意力机制模块。从图4中可以看出,当移除任意一个模块时,模型性能都出现了大幅下跌,这说明了模型中每个模块的不可或缺性;此外,可以看出PEACE w/o CPL的表现最差,这说明了原型学习在来捕获通用可迁移的知识中的重要性。
04
可视化分析
在线实验及业务落地情况
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-07-06
比Kimi还好用?AI写作神器「橙篇」来势汹汹 欲夺长文创作之未来
2024-07-06
暴走WAIC:跟AI+教育有关的,都在这儿↑
2024-07-02
【研究成果】ArchGPT:利用大语言模型支持传统建筑遗产的更新与保护
2024-06-28
所有男生女生,AI 卖货主播来咯!
2024-06-28
AI+医疗专题报告:院内场景丰富,AI 全面赋能医疗健康领域
2024-06-20
AI 背后 B 端设计师的机会
2024-06-20
30 款让教师工作更轻松的 AI 工具
2024-06-13
知识图谱(KG)和大模型(LLMs)双轮驱动的企业级AI平台构建之道暨行业调研
2024-05-03
2023-07-06
2023-06-30
2023-06-29
2023-07-03
2024-04-28
2023-07-01
2024-05-25
2023-07-10
2023-06-29