首页
天天,推荐系统都在捕获我们的兴趣与偏好。从刷过的视频到停留的直播间,算法总是聚焦在「内容」的明确上,推断用户喜欢哪类视频、哪种话题,善于在「内容层」识别用户喜欢什么,却很少真正明确「你是谁」。
快手消耗战略算法团队注重到了这一问题,他们想让推荐系统不止「会猜」,而是「懂你」。为填补这一缺失的建模角度,快手消耗战略算法团队联合快手基础大模子与应用部及武汉大学,提出了 TagCF 框架,让推荐系统从「知其然」迈向「知其以是然」。
该研究效果已被 NeurIPS 2025 吸收,相关代码与实验框架已周全开源,旨在为学术界与工业界提供一套以「明确驱动」为焦点的推荐系统要领论。
论文问题:Who You Are Matters: Bridging Topics and Social Roles via LLM-Enhanced Logical Recommendation论文: http://arxiv.org/abs/2505.10940代码: https://github.com/Code2Q/TagCF
配景和念头
用户明确:A Missing Formulation
图 2
当推荐系统通过统计模子学出两个内容之间的关联并据此举行推荐时,这种关联背后往往隐藏着用户角色这一「混杂因素」。如图2 所示,headset-symphonist-violin 的关联关系,实则泉源于「交响乐手」这一用户角色;在电阛阓景中,「啤酒-新晋奶爸-尿布」的经典案例同样印证了这一点。相比基于 ID 的古板隐式建模,引入user role视角让推荐系统得以更清晰地明确用户,从而迈向显式的可诠释推荐演进。
另一方面,当需要建模 topic-topic 关联时,自己可以将其看成 topic-role-topic 关联的效果图。这意味着引入 user role 的建模方法在逻辑上更具通用性与表达能力。这种通用的协偕行为建模,不但能捕获那些统计要领难以识别的弱交互,还能精准建模并有逻辑地突破用户的信息茧房(后文有验证)。
并且,团队还通过实验发明,基于 user role 的建模在统计意义上优于古板的 topic 建模,不但具备更稳固的空间,也能带来更显著的推荐效果提升。
综上所述,一个更有用的推荐系统需要有能力通过用户与物料之间的交互数据,学习到用户是一个什么样的人,并找到涉及用户角色的通用的原则性的客观逻辑纪律。
注:文章后续形貌中 user tag = user role = 用户特征,item tag = item topic = 兴趣点。
两个新使命
除了古板的推荐使命外,本研究借鉴 topic modeling 的思绪,为推荐系统拓展出两个新使命:
用户角色识别(User Role Identification):建模一个用户的特征、个性、社会角色、需求;其中特征包括但不限于用户直接提供的特征值(如性别和年岁)。
用户行为逻辑建模(Behavioral Logic Modeling):建模 user role 和 item topic 之间的逻辑关联图(如图3),可细分为 I2U 和 U2I 两个子使命:
I2U:具有某一特征(topic)的物料适合分发给什么特征(role)的用户。U2I:具有某种特征(role)的用户会希望看到什么特征(topic)的物料。
图3
解决计划
?樯杓
图4 - TagCF 主要功效?
TagCF 主要包括如下三个?椋
基于 MLLM 的视频内容明确中台:系统遍历天天新增的视频(抵达一定曝光数目后),使用 MLLM 模子(M3[1])对每个视频i提取多模态内容和视频 embedding,然后通过人工设计的 prompt(图5)指导 MLLM 模子明确视频语义,从而自动天生响应的 item tag 与 user tag,并实时更新标签库。
图5
基于 LLM 的行为逻辑图探索中台:在获得两种 tag 荟萃后,第二步就是构建 tag2tag 逻辑图,即 U2I 和 I2U 逻辑图。详细的,凭证给定的起始 tag,我们构建对应的逻辑推理 prompt(图6),并通过一个 LLM(QWen2.5-7B[2])来天生对侧的目的 tag。
图6
赋能下游推荐系统:在获得内容明确的 tag 信息和 tag2tag 逻辑图后,下游推荐系统可以使用这些中台信息对推荐模子举行对应的增强(属 LLM-for-rec 范式,有别于 LLM-as-rec 范式)。为了包管建?占涞囊恢滦,团队提出可以单独针对 itemtag 空间或 usertag 空间举行模子增强,对应的计划为TagCF-it和TagCF-ut。实验验证了三个可行的推荐系统增强计划:基于 tag 的 encoder 模子增强、基于 tag-logic 对齐的训练增强和基于 tag-logic 的预估分数增强。
注:文章以为内容明确中台产出的 tag-logic 系统虽然来自于推荐系统且验证于推荐系统,但其具有一定通用性,尤其行为逻辑图也被验证有一定迁徙能力,未来可以为其他相关营业(如电商和搜索)赋能。
挑战和工程计划
实现历程中也保存如下挑战:无限制天生导致的 tag 荟萃无序扩张、视频笼罩率长尾漫衍、无序天生和细腻打分需求的矛盾、大模子天生效果缺乏评测手段等。
为相识决上述问题,文章提出了几个有用的解决计划并在线上落地:
构建弱重叠高频 tag 子集,即 cover set:该要领旨在自动化地提取使用效率高的 tag 子集,在后验视察上发明高频 tag 履历上比长尾 tag 具有更好的通用性。cover set 的构建也分为 usertag 和 itemtag 两个对称的部分,其历程相近,详细流程如下:
履历上,cover sets 在量级上为 7k-20k 不等,相比开放语义空间中的全集,cover sets 能够在 30 天内收敛,在工业场景下具有足够的稳固性和通用性,有利于种种下游链路的研发。
对内容明确效果举行模子蒸馏:主要目的是凭证 MLLM 和 LLM 产出的 item2tag 数据和 tag2tag 数据训练对应的蒸馏小模子,以便对 tag 举行细腻排序,对应的蒸馏模子后续在推荐历程中也会被重复使用。
人工大模子比照验证:接纳经典的 Good-Same-Bad 战略,从准确率、完整度、合理性和可读性等多个维度举行了人工评测。效果显示,该要领在效果上已能知足工业级应用需求,整体体现与GPT-4o靠近。
显式茧房建模和突破
基于上述三个?,TagCF-it 模子延续兴趣点建模思绪,而 TagCF-ut 模子则拓展至用户角色识别与行为逻辑挖掘。至此,推荐系统已有能力显式地建模用户茧房并通过统计模子举行对齐。
详细的,团队通过学习获得的模子预估出对应的茧房内(top-20)tag 荟萃,记为 T(0),然后通过 U2I 和 I2U 逻辑图以一定 branch factor 举行发散,获得茧房外的 tag 荟萃,记为 T(1)。下图为示例:
可以显式控制的两种预预战略:
TagCF-util:仅使用T(0),维持茧房内特征,注重提升准确度。TagCF-expl:使用T(0)和T(1)的并集,突破茧房并举行相关新特征探索,注重提升多样性。
实验
离线实验
主实验在快手的 industrial 离线数据集上首先获得验证。
NDCG 和 MRR 是推荐准确率指标,Cover 和 Gini 是多样性指标。
实验结论:
TagCF 能有用增强 backbone 模子推荐效果。
提取的逻辑图中台可以 transfer 到其他数据集上(仅 transfer 逻辑图,item2tag 信息仍然需要特另外大模子推理天生和蒸馏模子对齐),且仍然能够提升对应 backbone 的效果。
两种 TagCF 变体泛起出差别的行为特征,TagCF-ut 整体准确率更好,TagCF-it 则更容易提升多样性。
三个增强?榈 Ablation 验证了对应?樯杓频挠杏眯。
线上实验
在研究中,团队举行了线上重排阶段的模子增强实验,其详细的 workflow 如下图:
团队举行了模子增强、训练增强和预估打分增强,且在打分增强阶段划分实验了 TagCF-util 和 TagCF-expl。
在实验中,团队发明 TagCF-expl 能够有用提升用户恒久留存指标 LT+0.037%。
别的,团队还视察到,usertag 荟萃比 itemtag 荟萃具有更强的稳固性和表达能力,体现在其更小的荟萃巨细、更快的收敛速率(如下表所示)以及 3.1 节所示更强的模子增强效果。这些优势意味着,相比兴趣点,用户角色是越发稳固的特征,越发适于推荐系统中的建模和剖析。
总结和思索
快手团队从推荐系统的「双端视角」出发,首次提出「视频明确与用户明确并重」的理念,并证实晰以用户明确为焦点的推荐系统在目今范式下的奇异优势。推荐系统的目的历来不但是「推荐内容」,它更关乎明确人(微观)与社会(宏观)的科学。
基于这一理念,团队构建了 TagCF ——包括 tag-logic 内容明确中台和推荐系统增强两个组成部分。tag-logic 内容明确中台具备强盛的可迁徙能力,其通用框架也可以在召回等其他链路阶段使用,未来可扩展至召回、电商、搜索等多营业场景;另一方面,推荐系统增强?榻心芰χ惫劢S没Ъ敕坎⒕傩型黄坪吞剿。
推荐系统与大模子的连系,正在让内容分发进入一个全新的阶段。
它能更智慧地明确用户、更精准地匹配内容,也带来了关于隐私、清静与公正的新思索。未来,团队将继续完善 tag-logic 中台系统,探索更高效的推理与资源使用方法。
恒久以来,行业主要深耕于统计模子建模路径,快手也相继推出了 OneRec[3] 与 GoalRank[4] 等代表性前沿手艺效果。而本文提出的显式用户明确与 tag-logic 建模要领,则在符号与统计两种范式之间搭起了桥梁,为行业带来了全新的想象空间。
更主要的是,tag-logic 逻辑图让系统有能力从用户的信息茧房出发,睁开有逻辑的语义探索——既坚持精准,又敢于突破。怎样在「准确」与「多样」之间找到平衡,正是推荐系统进化的要害命题。从「懂内容」到「懂人」,TagCF 的探索不但是手艺的一次跃迁,更是手艺贴近真实的人与社会的具象体现。
参考文献:
[1] Mu Cai, Jianwei Yang, Jianfeng Gao, and Yong Jae Lee. Proceedings of the 13th International Conference on Learning Representations, 2025.
[2] An Yang, Baosong Yang, Beichen Zhang, Binyuan Hui, Bo Zheng, Bowen Yu,Chengyuan Li, Dayiheng Liu, Fei Huang, Haoran Wei, et al. Qwen2. 5 technical report. arXiv preprint arXiv:2412.15115, 2024
[3] Zhou, Guorui, et al. "OneRec Technical Report." arXiv preprint arXiv:2506.13695 (2025).
[4] Zhang, Kaike, et al. "GoalRank: Group-Relative Optimization for a Large Ranking Model." arXiv preprint arXiv:2509.22046 (2025).
《亚洲欧美变态另类丝袜第一区》,《Q8X2R7L1T4J5M9B6W3》粉色视频AV免费下载
“美女A级视品”
www成人 色情美女双色乳球
……
12月04日
“男男十八禁 啪啪动漫”大学我有四不上
↓↓↓
12月04日,印尼勒沃托比火山一天内多次喷发,gogo国模大胆私拍,性欧美亚在线,小蓝视频gy2023双龙,免费观看黃色A片一级频
12月04日,跟着“悟空”游山西!山西文旅官员谈国产游戏带火取景地,玛薇卡在水中在线观看,哪里能看黄色网站,思思精品热中文字幕,htms一家本让人把持不住的乳房
12月04日,他为什么称自己是宋朝摄影师?,༄༊࿆J💞Jღ᭄ꦿ࿐,在家里操老肥逼视频,火影本子,乱伦小说亚洲图片
12月04日|韩国总统尹锡悦接受国防部长官辞呈|麻豆免费网址|91传媒下载|么公又大又硬又粗又爽的视频|亚洲国产福利第一页
12月04日|国乒混团世界杯小组赛提前出线 王楚钦:在心态上放得非常好|宁荣荣 爆乳 无遮挡|女人牲视频|中日韩激情一级无码免费毛片|精品欧美一区二区在线观看
12月04日|内蒙古阿左旗:湖清水静 赤麻鸭欢聚一“塘”|美欧尤物一级性爱在线观看|日逼视频国产精品免费看|一级A片免费视频|美女黄片……
12月04日,杭州富阳半程马拉松举行 14国选手跑进《富春山居图》,日韩欧美啪啪啪视频,很很日很佷干1,人人操人人干啊啊啊,××× 网站
12月04日,读懂夜校走红背后的文化需求,范冰冰婬片A片AAA毛片小说,黄色网免费入口,天天搞天天摸,国产香蕉
12月04日|(走进中国乡村)广西北海一老渔村变身“艺术村”|黄无码国产在线看下载|粉色abb苏州晶体有限公司|斗破苍穹3d动漫同人曹颖|AV 无码 白浆 cos
12月04日,前5月中蒙、中俄最大陆路口岸中欧班列开行超3000列,www.999在线,亚洲一区二区三区在线免费观看,日本又黄又刺激免费网站,亚洲无码在线涩涩
12月04日,多彩活动点亮福建武警“五一”假期生活,精品精品青草视频在线,如何打女孩子光阴塞生蒜,黄色视频网页日本,在线免费看色在线看色免费
12月04日,民航局:2024年春运民航旅客运输量预计将突破8000万人次,骚逼好痒,想吃狗鸡巴,精品无码一区在线观看无卡,国产 迷奸,天天综合网久久网亚洲
12月04日|哈尔滨机场迎来“五一”假期返程客流高峰|18禁止亚洲深夜福利入口|不卡的毛啊毛片免费的|19岁以下禁止入内网站|火影忍者雷影和纲手生猴子
12月04日|成都国际班列中越(成都-越南)冷链班列首发|白咲舞和樱井莉亚的身高对比|我c白丝玉足邻居阿姨|国产一级AV|婷婷五月天自拍
12月04日|“丝路百城传”之《撒马尔罕传》图书发布会在京举办|成年熟美女一级黃色A片|欧美va国内|影院黄色视频在线|国产一区AV麻豆免费观看
钱天一vs张本美和,猛龙总裁祝贺小加索尔退役|云南发现莲座蕨类植物新种|日韩欧美国产色综合|美女被操流水|国产九九视频一区二区三区|狼友视频www在线观看
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
第八届“强网杯”线下赛郑州启动 32支战队“逐鹿中原”
近距离|习主席称赞法国总理中文“讲得很好,很标准”
【奥运画刊】奥运在这一刻很温暖
【冰雪春天】习言道 | 冰天雪地也是金山银山
“信号升格”专项行动提升云南乡村医疗服务质效 为偏远地区接入更多优质医疗资源
外交部就习近平主席出席2024年中非合作论坛峰会开幕式并举行相关活动向中外媒体吹风
台湾大学生中华文化研习营开营 与大陆大学生“结对”开启四川之旅
大小莲花奥体中心全民健身场地再次开放 还馆于民
联播观察|关键词看改革 自主可控的产业链供应链
尹锡悦宣布紧急戒严后,韩前总统文在寅发声:希望国民们守护和拯救民主主义
内地三级精品自拍
国产精品一区二区熟女
西施被 到爽 高潮视頻
免费一区二区三区毛片完整版
王雨纯与周于希互怼互抚爱情剧
嗯啊色色视频
河娃极速版
业余半老成熟自由性别业余的定义
精品多人p群无码
黄色网站曰韩

闽公网安备 35010302000113号