首页
这项由复旦大学和快手科技联合完成的研究揭晓于2026年的《Under Review》期刊,研究团队提出了一个名为RecGOAT的突破性推荐系统框架。有兴趣深入相识的读者可以通过论文编号arXiv:2602.00682盘问完整论文。
当我们在网上购物时,推荐系统就像一位知心的购物助手,会凭证我们的浏览纪录和购置历史向我们推荐可能感兴趣的商品。然而,现在的推荐系统面临着一个重大的挑战,就犹如一位翻译官试图在两种完全差别的语言之间举行交流一样难题。
一方面,大语言模子和视觉模子拥有富厚的天下知识,能够深刻明确商品的文字形貌和图像内容,就像一位博学的学者能够准确明确每件商品的特征和价值。另一方面,古板推荐系统依赖的是用户行为数据,好比点击、购置等纪录,这些数据更像是一串串笼统的数字密码。
问题在于,这两套"语言系统"之间保存着严重的语义鸿沟。大模子看到的是商品的富厚语义信息,而推荐系统处置惩罚的却是简朴的用户ID和商品ID编码。这就好比一个醒目文学的诗人和一个只会数学公式的工程师试图相助写一本书,他们各自的专长无法有用连系。
研究团队通过实验发明了一个令人震惊的征象:当直接将大模子的语义体现与古板推荐系统的ID特征融适时,推荐效果不但没有提升,反而泛起了显著下降。在婴儿用品数据集上,这种简朴融合导致推荐准确率下降了约30%。这个发明证实晰语义冲突问题的严重性。
为相识决这个根天性问题,研究团队开发了RecGOAT框架,这个名字泉源于"Graph Optimal Adaptive Transport"(图最优自顺应传输)。这套系统的焦点头脑是建设一座精巧的"语义桥梁",让大模子的天下知识与推荐系统的行为数据能够真正融合。
一、构建智能图谱:让商品和用户建设深层联系
RecGOAT的第一步是为每种模态构建专门的图网络,这个历程就像为差别类型的信息建设专属的社交网络。
关于商品信息,研究团队使用了最先进的大模子来明确内容。他们选用Qwen3-Embedding-8B模子来处置惩罚商品的文字形貌,这个模子能够深刻明确商品问题、品牌、种别和详细形貌中的语义信息。同时,他们使用LLaVA-1.5-7B视觉模子来剖析商品图片,提取视觉特征。这个历程就像让一位文学专家和一位艺术鉴赏家划分从文字和图像角度来明确每件商品。
接下来,系统会凭证商品之间的语义相似性构建商品关联图谱。详细来说,关于每件商品,系统会找到与它最相似的K个商品,然后在它们之间建设毗连。这就像在商品天下中绘制一张关系网,相似的商品会被毗连起来,形成一个个商品社群。
关于用户建模,RecGOAT接纳了一种立异的要领。古板推荐系统通常只能给用户分派一个随机的ID编号,就像给每小我私家发一张只有编号的身份证,无法反应用户的真实特征和偏好。RecGOAT则使用QwQ-32B大模子来剖析用户的历史行为,天生个性化的用户偏好形貌。
系统会为每个用户建设一个详细的行为剖析提醒,包括用户的历史互动纪录和响应商品的详细信息。然后让大模子饰演专业数据剖析师的角色,通过结构化推理来识别用户行为中的配合属性,并总结用户在多个维度上的偏好特征。这个历程就像让一位心理学专家通过视察用户的购置历史来剖析其性格特征和喜欢倾向。
天生用户偏好形貌后,系统会将这些文字形貌转换为向量体现,然后构建用户之间的相似性图谱。这样,具有相似偏好的用户会在图谱中形成社群,系统可以通过用户间的关系来更好地明确和展望用户行为。
在处置惩罚用户-商品交互图谱时,RecGOAT接纳了轻量级的LightGCN架构。这个图网络会通过多层信息撒播来学习用户和商品的协同过滤体现。系统还会思量显式的评分信息,将用户的评分作为注重力系数来调理信息撒播的强度。
二、双层语义对齐:消除大模子与推荐系统的代沟
解决语义冲突的焦点在于RecGOAT独创的双粒度语义对齐框架,这套要领就像同时举行微观和宏观两个层面的翻译事情。
在微观层面,RecGOAT接纳跨模态比照学习来实现实例级对齐。这个历程类似于语言学习中的单词比照训练。关于每件商品,系统会形成多个模态对:ID体现与文本体现、ID体现与视觉体现、文本体现与视觉体现。系统的目的是让统一商品在差别模态下的体现尽可能相似,而差别商品的体现尽可能差别。
详细来说,系统使用InfoNCE损失函数来优化这个比照学习历程。当处置惩罚一个正样本对(统一商品的两种体现)时,系统会盘算它们之间的相似度,并与批次内其他负样本对(差别商品的体现)举行比照。通过这种比照学习,系统能够学到具有判别性的跨模态体现,确保差别模态对统一商品的明确坚持一致。
在宏观层面,RecGOAT引入了基于最优传输理论的漫衍级对齐要领,这是该研究最具立异性的孝顺之一。这个要领的焦点头脑是将语义对齐问题转化为一个运输问题:怎样以最小的价钱将大模子的语义漫衍"运输"到推荐系统的ID漫衍空间中。
最优传输理论就像物流配送的数学表达。假设有两个客栈,一个存储大模子提取的语义特征,另一个存储推荐系统的ID特征。最优传输算法要解决的问题是:怎样设计运输计划,以最小的总本钱将第一个客栈的货物运送到第二个客栈,使得两个客栈的漫衍抵达一致。
在数学层面,系统首先盘算语义模态漫衍与ID漫衍之间的本钱矩阵。这个本钱反应了差别特征之间的语义差别水平。然后,系统使用Sinkhorn-Knopp算法高效求解最优传输计划,获得一个传输矩阵,形貌了怎样将每个语义特征映射到ID空间中。
为了让这个几何驱动的传输历程能够顺应详细的推荐使命,RecGOAT引入了自顺应传输机制。系统在基础传输矩阵的基础上增添了可学习的残差矩阵,使得传输历程能够凭证下游推荐使命的需求举行微调。最终的自顺应传输矩阵即是基础传输矩阵加上残差矩阵。
通过这种自顺应传输,每个大模子增强的模态特征都会被传输到ID嵌入空间中,获得语义对齐的体现。这个历程有用缓解了差别语义空间之间的漫衍差别,确保了语义一致性。
三、理论包管:为什么RecGOAT能够做到最优融合
RecGOAT不但在实践中体现精彩,研究团队还为其提供了严酷的理论包管,这些理论就像数学定理一样为系统的有用性提供了科学依据。
研究团队提出了两个焦点理论包管:对齐一致性和融合周全性。对齐一致性包管是指,通过双粒度对齐后,任何简单模态的误差与统一体现误差之间的差别都能被有用控制。这个差别的上界由Wasserstein距离和InfoNCE损失配合决议。
换句话说,若是系统在漫衍级对齐(Wasserstein距离)和实例级对齐(InfoNCE损失)上都做得很好,那么差别模态的体现就会具有很强的一致性。这个理论效果证实晰双粒度对齐设计的合理性。
融合周全性包管越发有趣,它证实晰融合后的统一体现的性能上界可以抵达所有简单模态中的最佳性能,再加上对齐误差项。这意味着,通过有用的对齐,多模态融合不但不会损害性能,还能够充分整合各个模态的互补信息,实现逾越任何简单模态的效果。
为了推导这些理论效果,研究团队做出了几个合理的假设。首先,他们假设用户嵌入是牢靠且有界的,这在现实推荐场景中是合理的,由于用户特征通常不会爆发强烈转变。其次,他们假设真实偏好函数具有Lipschitz一连性,这反应了用户偏好的内在平滑性。
基于这些假设,团队证实晰两个要害引理。第一个引理建设了实例级距离与比照学习损失之间的联系,批注通过优化InfoNCE损失,可以有用缩小差别模态体现之间的距离。第二个引理将模态特定误差与统一体现误差联系起来,展示了漫衍级对齐和实例级对齐怎样配合影响最终的融合效果。
这些理论效果不但为RecGOAT的有用性提供了数学证实,也为未来的多模态推荐研究提供了理论指导。研究团队通过严酷的数学剖析,证实晰他们的要领在理论上是最优的,这为该手艺的现实应用提供了强有力的科学支持。
四、实验验证:在真实天下中的卓越体现
为了验证RecGOAT的现实效果,研究团队在三个Amazon果真数据集上举行了周全的实验评估,这些数据集划分涵盖婴儿用品、体育用品和电子产品三个差别领域。
实验设计就像一场公正的竞赛,RecGOAT需要与多个强有力的敌手举行较量。这些敌手包括古板的基于ID的要领(如BPR和LightGCN)、多种多模态推荐要领(如VBPR、FREEDOM、DiffMM、UGT和FindRec),以及最新的基于大模子的推荐要领(如TALLRec、A-LLMRec、UniMP和IRLLRec)。
实验效果令人印象深刻。在所有三个数据集上,RecGOAT都取得了统计显著的最佳性能。以电子产品数据集为例,在Recall@10指标上,RecGOAT抵达了0.0468的得分,比第二名UGT的0.0430提升了8.84%。在NDCG@10指标上,RecGOAT的得分为0.0271,比第二名UGT的0.0254提升了6.69%。
更主要的是,实验展现了几个要害洞察。首先,多模态要领普遍优于古板的基于ID的要领,这证实了多模态信息在缓解数据希罕性方面的价值。然而,基于大模子的要领在没有适当对齐的情形下,通常体现不如古板多模态基线,这突出了语义冲突问题的严重性。
RecGOAT相比其他大模子增强要领的显著优势,主要归功于其独创的漫衍级对齐机制。与IRLLRec相比,RecGOAT使用Wasserstein距离而不是KL散度举行漫衍对齐,这使得系统能够更好地坚持语义结构。KL散度只关注概率密度的比值,而忽略了样本空间的几何结构。举例来说,将特征"红色"对齐为"紫色"与对齐为"室内物品"在KL散度下可能获得相似的处分,但Wasserstein距离会给前者分派更低的本钱,由于它们在语义上更相关。
为了深入明确各个组件的孝顺,研究团队举行了详细的消融实验。他们较量了仅使用ID的基线要领、简朴的多模态融合要领(如毗连和求和),以及RecGOAT的各个组件(仅CMCL、仅OAT和完整的RecGOAT)。
消融实验的效果很是有启发性。简朴的多模态融合要领(毗连或求和)经常爆发比仅使用ID要领更差的效果,这再次证实了语义冲突的保存。在RecGOAT的两个主要组件中,最优自顺应传输(OAT)的孝顺通常大于跨模态比照学习(CMCL),这突出了漫衍级对齐的要害主要性。然而,两个组件的有机连系爆发了最佳效果,批注它们是互补的而不是竞争的。
五、对齐效果的可视化验证
为了直观地验证理论剖析的准确性,研究团队设计了巧妙的可视化实验来展示对齐一致性和融合周全性。
对齐一致性的验证接纳了三角热力争的方法,展示了在差别模态权重组合下的推荐性能。实验效果显示,无论怎样调解文本、视觉和ID模态的权重组合,系统的性能都坚持在一个相对稳固的规模内,性能差别不凌驾5%。这种稳固性批注,经由对齐处置惩罚的差别模态体现具有很强的一致性,它们对最终推荐效果的孝顺是可靠和可展望的。
融合周全性的验证则通过较量简单模态体现与融合体现的性能来实现。实验效果清晰地显示,融合后的统一体现在所有评估指标上都逾越了任何简单的对齐模态体现。这个效果与理论剖析完全一致,证实晰通过有用对齐,多模态融合能够充分整合各个模态的互补信息,实现1+1>2的效果。
特殊值得注重的是,纵然是体现最好的简单模态(通常是ID模态),其性能也显着低于融合体现。这批注文本和视觉模态在经由适当对齐后,确实为推荐系统提供了有价值的增补信息,而不但仅是噪声。
六、工业级应用的可行性
虽然论文中由于公司审核要求没有详细披露在线实验的效果,但研究团队在大规模在线广告平台上安排了RecGOAT,这证实晰该要领的工业级可扩展性和适用性。
从手艺架构角度来看,RecGOAT的设计充分思量了工业应用的需求。系统接纳磷七效的Sinkhorn-Knopp算法来求解最优传输问题,该算法具有线性收敛性子,能够在大规模数据上快速运行。同时,自顺应传输矩阵的引入使得系统能够在坚持通用性的同时,针对特定使命举行优化。
在现实安排中,RecGOAT的?榛杓剖沟盟梢晕扌暗赜胂钟型萍鱿低臣。图网络?榭梢允褂孟钟械挠没-商品交互数据,而大模子增强?榭梢曰谙钟械纳唐纺谌菪畔⒕傩泄菇。双粒度对齐?樵蜃魑黄渲行牟,可以插入到现有的推荐管道中。
从盘算效率角度来看,RecGOAT的在线推理阶段主要涉及向量查找和简朴的线性变换,盘算重漂后较低。大模子的推理主要在离线特征提取阶段举行,不会影响在线效劳的响应速率。这种设计使得RecGOAT能够在坚持高精度的同时,知足工业级推荐系统对延迟的严酷要求。
说究竟,RecGOAT代表了推荐辖档挽域的一个主要里程碑。它不但解决了大模子与古板推荐系统融合中的焦点手艺难题,还为这一融合提供了坚实的理论基础。这项研究就像为两个差别文化的社群建设了一座结实的桥梁,让它们能够真正实现深度相助。
从现实应用的角度来看,RecGOAT的意义远凌驾了手艺自己。随着大模子手艺的快速生长,怎样将这些强盛的语义明确能力有用整合到现有的推荐系统中,已经成为整个行业面临的配合挑战。RecGOAT提供的双粒度对齐框架为解决这一挑战提供了一个通用的、理论驱动的解决计划。
更主要的是,这项研究开启了多模态推荐系统的新纪元。通过有用融合大模子的天下知识与推荐系统的行为数据,未来的推荐系统将能够更深入地明确用户的真实需求和偏好,提供越发精准、个性化的推荐效劳。这不但会改善用户的购物体验,也会为电商平台带来更高的转化率和用户知足度。
关于研究社区来说,RecGOAT的理论孝顺同样主要。该研究建设的对齐一致性和融合周全性理论框架,为未来的多模态融合研究提供了主要的理论指导。这些理论洞察不但适用于推荐系统,也可能为其他需要融合多种数据源的机械学习应用提供借鉴。
展望未来,RecGOAT的乐成也体现了人工智能生长的一个主要趋势:差别AI手艺之间的深度融合将成为推下手艺前进的要害动力。正如RecGOAT乐成融合了大模子的语义明确与推荐系统的行为建模,未来我们可能会看到更多这样的跨手艺融合立异,配合推感人工智能手艺向着越发智能、越发适用的偏向生长。
Q&A
Q1:RecGOAT框架主要解决什么问题?
A:RecGOAT主要解决大语言模子与古板推荐系统之间的语义冲突问题。就像让一个醒目文学的诗人和只会数学公式的工程师相助一样难题,大模子明确的是富厚的语义信息,而推荐系统处置惩罚的是简朴的用户ID和商品ID编码,两者直接融合会导致推荐效果下降30%左右。
Q2:双粒度语义对齐是怎样事情的?
A:双粒度对齐包括微观和宏观两个层面。微观层面通过比照学习让统一商品在差别模态下的体现相似,宏观层面使用最优传输理论将大模子的语义漫衍"运输"到推荐系统的ID漫衍空间中,就像设计最优物流计划将两个客栈的货物漫衍调解一致。
Q3:RecGOAT的推荐效果比其他要领好几多?
A:在三个Amazon数据集上,RecGOAT都取得了最佳性能。以电子产品为例,在Recall@10指标上比第二名提升了8.84%,在NDCG@10指标上提升了6.69%。更主要的是,所有提升都具有统计显著性,证实晰要领的可靠性。
《hhh蜜桃 17.chhh》,《Q8X2R7L1T4J5M9B6W3》免费一级黄色大片
“无遮挡▓男同网站”
爽爽的电影AV片
……
02月08日
“jizzon国产”复旦一教师刺死学院书记 被判死缓
↓↓↓
02月08日,政策“组合拳”+数字化建设 中国高水平对外开放铺展恢宏画卷,男男gaygays18禁入口,明星无码中文视频一区,日本道黄色大片,一级美女一级射视频
02月08日,(乡村行·看振兴)赣南黄元米果:传统美食助力乡村振兴,黄油网站破解版,胡桃玩旅行者的小坤坤网站在线看,国语自产拍在线观看对白,在线看欧美性爱
02月08日,(经济观察)上海聚焦转型金融加快打造国际绿色金融枢纽,1024视频在线观看无码,美女视频黄的免费视频网页,国产一区二区视频网站,美女一级a裸片免费久久
02月08日|中国和巴西务实合作提质升级|成人免费毛片❌❌❌!|一级A片刺激高潮一|av网站一级在线|七色色亚洲
02月08日|“盲盒”营销不能盲目|欧美嘿咻嘿咻视频播放|欧美女人aa看片|人人上人人草|91超碰人人
02月08日|农业农村部:确保2024年粮食产量保持在1.3万亿斤以上|亚洲高清一区二区三区尤物|a片在线不卡|体育生白袜出精 网站|9·1免费版安装……
02月08日,2023年中国城镇调查失业率均值5.2% 同比下降0.4个百分点,国产免费A片在线观看不卡,久久国产精品1999,最新毛片A片免费看,“黄色网址在线观看”
02月08日,香港举行武艺操汇演 逾400名中小学生“切磋武艺”,日本公妇手机在线观看免费,星野和鱼哥视频原版,人人艹人人舔,天天色综合网址
02月08日|《好东西》的轻盈感来自哪里 |啊 学长 好硬 拔出来猫咪软件|综合在线一区|一级作爱|www.呦香阁
02月08日,中国企业出海 带火印尼“工业旅游”,一级作爱片,18禁在线网址,国产在观看A片一区二区,黄色片黄色一级片
02月08日,外交部副部长陈晓东谈中方对中非合作论坛建设期待,猎奇av,男男艹,国产精品福利自产拍网站,人人人人人操人人人人人操
02月08日,中国财政部:利比里亚共和国籍应税船舶适用船舶吨税优惠税率,久久有限九九,日本一区二区黄色视频,云缨撕开内衣露双乳狂射,日韩精品无码专区第100页
02月08日|玩的就是心跳 “五一”假期中外游客赴张家界感受极限刺激|搜天天色网站|日本扒衣摸双乳视频|欧美疯狂视频一级视频|插女性视频
02月08日|秋冬季心血管病高发 谨防与带状疱疹混淆耽误病情|女色综合|毛片免费看在线|日本黄网站址精品|斩神红缨h乳欲伦岳小说
02月08日|湖北对共建“一带一路”国家进出口规模创新高|小 伸进 猎奇|天天日屄|韩国三级免费在线观看|一级大黄片欧美性爱
蒋奇明演于适老丈人,官方回应体育总局干部发表不当言论|海南省军区某部参谋高海超:多下苦功夫,关键时刻才能顶得上|国产91在线精品国自产在线|辶喿扌畐的表情包app下载-辶喿扌畐的表情包v84.2.81.9.2|白虎腿校花c到失禁|手机在线观看AV不卡网站
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
王雅繁、商竣程、郑钦文艰难晋级澳网单打第二轮
人工智能能力建设国际合作之友小组在联合国正式成立 中方介绍情况
中国和古巴将于5月17日恢复直航,北上广居民搜索热情较高
应急管理部将低温雨雪冰冻灾害Ⅳ级应急响应范围扩至11省份
丁薛祥出席世界领导人气候行动峰会并致辞
菲律宾大坝干涸 300年古镇遗址“重现天日”
清华珠三角研究院未来设计创新中心广州揭牌
上海外高桥港区海关查获伪报香烟96万支
长期喝咖啡会致反流性咽喉炎?
小新Talkshow:藏式下午茶有多精致!
中国一级婬片A片AAA毛片
mmd巨乳18r
歐美黃色視頻网站
先锋av资源网站资源亚洲
黄色爱情一级片
国产免费无遮挡精品视频
无码一级毛片直播视频
一级毛片国产A级毛片APP
美欧美牲交一二三区免费在线
精品久久国产综合婷婷

闽公网安备 35010302000113号