国产拍视频,海量高清资源免费畅享,热门影视综艺一网打尽

k1体育麻将胡了

搜索 猫眼影戏 融媒体矩阵
  • 山东手机报

  • 猫眼影戏

  • 公共网官方微信

  • 公共网官方微博

  • 抖音

  • 人民号

  • 天下党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

推荐系统真正「懂你」:快手团队在NeurIPS 2025提出新效果TagCF

2025-12-03 20:04:03
泉源:

猫眼影戏

作者:

刘兵

手机审查

  猫眼影戏记者 金沙湖 报道Q8X2R7L1T4J5M9B6W3

天天,推荐系统都在捕获我们的兴趣与偏好 。从刷过的视频到停留的直播间,算法总是聚焦在「内容」的明确上,推断用户喜欢哪类视频、哪种话题,善于在「内容层」识别用户喜欢什么,却很少真正明确「你是谁」 。

快手消耗战略算法团队注重到了这一问题,他们想让推荐系统不止「会猜」,而是「懂你」 。为填补这一缺失的建模角度,快手消耗战略算法团队联合快手基础大模子与应用部及武汉大学,提出了 TagCF 框架,让推荐系统从「知其然」迈向「知其以是然」 。

该研究效果已被 NeurIPS 2025 吸收,相关代码与实验框架已周全开源,旨在为学术界与工业界提供一套以「明确驱动」为焦点的推荐系统要领论 。

论文问题:Who You Are Matters: Bridging Topics and Social Roles via LLM-Enhanced Logical Recommendation论文: http://arxiv.org/abs/2505.10940代码: https://github.com/Code2Q/TagCF

配景和念头

用户明确:A Missing Formulation

图 2

当推荐系统通过统计模子学出两个内容之间的关联并据此举行推荐时,这种关联背后往往隐藏着用户角色这一「混杂因素」 。如图2 所示,headset-symphonist-violin 的关联关系,实则泉源于「交响乐手」这一用户角色;在电阛阓景中,「啤酒-新晋奶爸-尿布」的经典案例同样印证了这一点 。相比基于 ID 的古板隐式建模,引入user role视角让推荐系统得以更清晰地明确用户,从而迈向显式的可诠释推荐演进 。

另一方面,当需要建模 topic-topic 关联时,自己可以将其看成 topic-role-topic 关联的效果图 。这意味着引入 user role 的建模方法在逻辑上更具通用性与表达能力 。这种通用的协偕行为建模,不但能捕获那些统计要领难以识别的弱交互,还能精准建模并有逻辑地突破用户的信息茧房(后文有验证) 。

并且,团队还通过实验发明,基于 user role 的建模在统计意义上优于古板的 topic 建模,不但具备更稳固的空间,也能带来更显著的推荐效果提升 。

综上所述,一个更有用的推荐系统需要有能力通过用户与物料之间的交互数据,学习到用户是一个什么样的人,并找到涉及用户角色的通用的原则性的客观逻辑纪律 。

注:文章后续形貌中 user tag = user role = 用户特征,item tag = item topic = 兴趣点 。

两个新使命

除了古板的推荐使命外,本研究借鉴 topic modeling 的思绪,为推荐系统拓展出两个新使命:

用户角色识别(User Role Identification):建模一个用户的特征、个性、社会角色、需求;其中特征包括但不限于用户直接提供的特征值(如性别和年岁) 。

用户行为逻辑建模(Behavioral Logic Modeling):建模 user role 和 item topic 之间的逻辑关联图(如图3),可细分为 I2U 和 U2I 两个子使命:

I2U:具有某一特征(topic)的物料适合分发给什么特征(role)的用户 。U2I:具有某种特征(role)的用户会希望看到什么特征(topic)的物料 。

图3

解决计划

?樯杓

图4 - TagCF 主要功效?

TagCF 主要包括如下三个?椋

基于 MLLM 的视频内容明确中台:系统遍历天天新增的视频(抵达一定曝光数目后),使用 MLLM 模子(M3[1])对每个视频i提取多模态内容和视频 embedding,然后通过人工设计的 prompt(图5)指导 MLLM 模子明确视频语义,从而自动天生响应的 item tag 与 user tag,并实时更新标签库 。

图5

基于 LLM 的行为逻辑图探索中台:在获得两种 tag 荟萃后,第二步就是构建 tag2tag 逻辑图,即 U2I 和 I2U 逻辑图 。详细的,凭证给定的起始 tag,我们构建对应的逻辑推理 prompt(图6),并通过一个 LLM(QWen2.5-7B[2])来天生对侧的目的 tag 。

图6

赋能下游推荐系统:在获得内容明确的 tag 信息和 tag2tag 逻辑图后,下游推荐系统可以使用这些中台信息对推荐模子举行对应的增强(属 LLM-for-rec 范式,有别于 LLM-as-rec 范式) 。为了包管建?占涞囊恢滦,团队提出可以单独针对 itemtag 空间或 usertag 空间举行模子增强,对应的计划为TagCF-it和TagCF-ut 。实验验证了三个可行的推荐系统增强计划:基于 tag 的 encoder 模子增强、基于 tag-logic 对齐的训练增强和基于 tag-logic 的预估分数增强 。

注:文章以为内容明确中台产出的 tag-logic 系统虽然来自于推荐系统且验证于推荐系统,但其具有一定通用性,尤其行为逻辑图也被验证有一定迁徙能力,未来可以为其他相关营业(如电商和搜索)赋能 。

挑战和工程计划

实现历程中也保存如下挑战:无限制天生导致的 tag 荟萃无序扩张、视频笼罩率长尾漫衍、无序天生和细腻打分需求的矛盾、大模子天生效果缺乏评测手段等 。

为相识决上述问题,文章提出了几个有用的解决计划并在线上落地:

构建弱重叠高频 tag 子集,即 cover set:该要领旨在自动化地提取使用效率高的 tag 子集,在后验视察上发明高频 tag 履历上比长尾 tag 具有更好的通用性 。cover set 的构建也分为 usertag 和 itemtag 两个对称的部分,其历程相近,详细流程如下:

履历上,cover sets 在量级上为 7k-20k 不等,相比开放语义空间中的全集,cover sets 能够在 30 天内收敛,在工业场景下具有足够的稳固性和通用性,有利于种种下游链路的研发 。

对内容明确效果举行模子蒸馏:主要目的是凭证 MLLM 和 LLM 产出的 item2tag 数据和 tag2tag 数据训练对应的蒸馏小模子,以便对 tag 举行细腻排序,对应的蒸馏模子后续在推荐历程中也会被重复使用 。

人工大模子比照验证:接纳经典的 Good-Same-Bad 战略,从准确率、完整度、合理性和可读性等多个维度举行了人工评测 。效果显示,该要领在效果上已能知足工业级应用需求,整体体现与GPT-4o靠近 。

显式茧房建模和突破

基于上述三个?,TagCF-it 模子延续兴趣点建模思绪,而 TagCF-ut 模子则拓展至用户角色识别与行为逻辑挖掘 。至此,推荐系统已有能力显式地建模用户茧房并通过统计模子举行对齐 。

详细的,团队通过学习获得的模子预估出对应的茧房内(top-20)tag 荟萃,记为 T(0),然后通过 U2I 和 I2U 逻辑图以一定 branch factor 举行发散,获得茧房外的 tag 荟萃,记为 T(1) 。下图为示例:

可以显式控制的两种预预战略:

TagCF-util:仅使用T(0),维持茧房内特征,注重提升准确度 。TagCF-expl:使用T(0)和T(1)的并集,突破茧房并举行相关新特征探索,注重提升多样性 。

实验

离线实验

主实验在快手的 industrial 离线数据集上首先获得验证 。

NDCG 和 MRR 是推荐准确率指标,Cover 和 Gini 是多样性指标 。

实验结论:

TagCF 能有用增强 backbone 模子推荐效果 。

提取的逻辑图中台可以 transfer 到其他数据集上(仅 transfer 逻辑图,item2tag 信息仍然需要特另外大模子推理天生和蒸馏模子对齐),且仍然能够提升对应 backbone 的效果 。

两种 TagCF 变体泛起出差别的行为特征,TagCF-ut 整体准确率更好,TagCF-it 则更容易提升多样性 。

三个增强?榈 Ablation 验证了对应?樯杓频挠杏眯 。

线上实验

在研究中,团队举行了线上重排阶段的模子增强实验,其详细的 workflow 如下图:

团队举行了模子增强、训练增强和预估打分增强,且在打分增强阶段划分实验了 TagCF-util 和 TagCF-expl 。

在实验中,团队发明 TagCF-expl 能够有用提升用户恒久留存指标 LT+0.037% 。

别的,团队还视察到,usertag 荟萃比 itemtag 荟萃具有更强的稳固性和表达能力,体现在其更小的荟萃巨细、更快的收敛速率(如下表所示)以及 3.1 节所示更强的模子增强效果 。这些优势意味着,相比兴趣点,用户角色是越发稳固的特征,越发适于推荐系统中的建模和剖析 。

总结和思索

快手团队从推荐系统的「双端视角」出发,首次提出「视频明确与用户明确并重」的理念,并证实晰以用户明确为焦点的推荐系统在目今范式下的奇异优势 。推荐系统的目的历来不但是「推荐内容」,它更关乎明确人(微观)与社会(宏观)的科学 。

基于这一理念,团队构建了 TagCF ——包括 tag-logic 内容明确中台和推荐系统增强两个组成部分 。tag-logic 内容明确中台具备强盛的可迁徙能力,其通用框架也可以在召回等其他链路阶段使用,未来可扩展至召回、电商、搜索等多营业场景;另一方面,推荐系统增强?榻心芰χ惫劢S没Ъ敕坎⒕傩型黄坪吞剿 。

推荐系统与大模子的连系,正在让内容分发进入一个全新的阶段 。

它能更智慧地明确用户、更精准地匹配内容,也带来了关于隐私、清静与公正的新思索 。未来,团队将继续完善 tag-logic 中台系统,探索更高效的推理与资源使用方法 。

恒久以来,行业主要深耕于统计模子建模路径,快手也相继推出了 OneRec[3] 与 GoalRank[4] 等代表性前沿手艺效果 。而本文提出的显式用户明确与 tag-logic 建模要领,则在符号与统计两种范式之间搭起了桥梁,为行业带来了全新的想象空间 。

更主要的是,tag-logic 逻辑图让系统有能力从用户的信息茧房出发,睁开有逻辑的语义探索——既坚持精准,又敢于突破 。怎样在「准确」与「多样」之间找到平衡,正是推荐系统进化的要害命题 。从「懂内容」到「懂人」,TagCF 的探索不但是手艺的一次跃迁,更是手艺贴近真实的人与社会的具象体现 。

参考文献:

[1] Mu Cai, Jianwei Yang, Jianfeng Gao, and Yong Jae Lee. Proceedings of the 13th International Conference on Learning Representations, 2025.

[2] An Yang, Baosong Yang, Beichen Zhang, Binyuan Hui, Bo Zheng, Bowen Yu,Chengyuan Li, Dayiheng Liu, Fei Huang, Haoran Wei, et al. Qwen2. 5 technical report. arXiv preprint arXiv:2412.15115, 2024

[3] Zhou, Guorui, et al. "OneRec Technical Report." arXiv preprint arXiv:2506.13695 (2025).

[4] Zhang, Kaike, et al. "GoalRank: Group-Relative Optimization for a Large Ranking Model." arXiv preprint arXiv:2509.22046 (2025).

??时势1:综合无码一区二区三区四区五区

??12月03日,2024年京北快乐足球节落幕 传递健康运动理念,

捷信逾期一年说要起诉我,我该怎么办?

,日本黄色片xxxxx视频 。

??12月03日,中国铁路上海局集团有限公司上海客运段开展“心聚力向未来 乘高铁迎进博”主题活动,

  第二,强化决议落实,充分验展好催促检查作用 。 为政之要,重在落实,抓落实是党委办公室的主要使命之一 。各级党委办公室要围绕党委中心事情,健全抓落实的机制,明确抓落实的责任,形成抓落实的协力 。抓落实要把大事抓细、小事抓实,确保事事有着落、件件有回音;抓落实要考究方法要领,阻止重复抓、多头抓,对统一问题要选准切入点,捉住要害,加大推进力度;抓落实还要善于发明决议推进历程中的不落实问题,深入开展督查,敢于动真格,敢于“拔钉子”,做到问题不解决不放过、责任不追究不放过、群众不知足不放过,真正督出权威,督出实效 。

,黄页网站免费观看视频,亚洲夜色好视频免费看,乳神aletta ocean vk 。

??时势2:毛片久久网站

??12月03日,国家邮政局部署开展邮政快递业安全生产重大事故隐患大排查大整治 ,  年龄旅游副总司理周卫红体现,随着更多客源地的境外游客得以通过更便捷的方法来到中国,相识、感受中国的开放态度、全球胸怀,旅游企业也将连系更多体验性的文化内容,设计富厚多样的收支境游新品 。同时,澳大利亚、新西兰也有着许多华人华侨,片面免签的推出,在利便他们回国探亲探友之余,同时也可以通过旅游,来看看中国爆发的深刻转变,体验富厚多彩的生涯和文化 。,淫性网,最新国产视频,4444中文在线 。

??12月03日,新华社快讯:据孟加拉国总统办公室6日消息,孟加拉国总统当天宣布解散国民议会,

  “这一百多号人都爬下了,就剩下你们三个了,都一起过来趴着吧!”小不点露出一嘴白生生的小牙齿,在这些人眼中简直就像是小恶魔 。

,女模秘秘 免费视频网站,一级做a爰片爱橙影院,一一本大道香蕉大无l吗 。

??时势3:原神大尺度视频网站

??12月03日,第七届长三角科交会开幕 首次推出科技人才招聘和科技金融专区,

城镇化事情聚会讲话质料 篇1

,chinese富婆mass,久久无码网站,久久999精品 。

??12月03日,新疆阿克苏地区乌什县发生7.1级地震 27趟列车运行受影响,

北京社保医疗就医不必也能报销的定点医院

,欧洲视频无区无码免费,免费VA爱视频在线观看,宁荣荣胯下娇吟玉腿撞击视频 。

??时势4:熟妇激情内激情内射图片

??12月03日,美图推出6款产品 吴欣鸿:深耕AI应用,让每个人都能享受到AI的价值,  在今年6月11日举行的中国福利会第八届执行委员会第一次聚会上,李斌指出,中;嵋钊胙肮岢沟车亩缶窈拖敖阶苁榧侵轮懈;峤ㄉ80周年主要贺信精神,秉持宋庆龄“永远和党在一起”的坚定信心,继续致力于创立未来的事业,在妇幼保健、校内外教育、少儿文化及社会福利等方面开展实验树模事情 。,小沙的宝库视频,大胸禁软件,2020国内自拍偷拍视频 。

??12月03日,“中华”酒领唱《我和我的祖国》,北京卫视“滚烫歌会”开唱,

  他们曾去过现场,那种恐怖时势,比在千军万马间冲杀还危险,一块巨石从那么高的地方落下,力道何止万斤,真要砸中,必定会化成肉泥!

,国产 高潮 白浆,国产A片欧美黄片,五月天色色网免费视频性色色色密桃色色色性丁香 。

责编:姜圣林

审核:陈向先

责编:李世民

相关推荐 换一换

Copyright (C) 2001-   dzwww.com. All Rights Reserved

新闻信息效劳允许证 - 音像制品出书允许证 - 广播电视节目制作谋划允许证 - 网络视听允许证 - 网络文化谋划允许证

山东省互联网传媒集团主理  联系电话:0531-85193202  违法不良信息举报电话:0531-85196540

鲁ICP备09023866号-1   鲁公网安备 37010202000111号  

Copyright (C) 2001- Dzwww   鲁ICP备09023866号-1

网站地图