(8分钟轻松上手)人人爽人人操官网安卓版v32.39.18.8.65.92.0.69-2265安卓网

k1体育麻将胡了

搜索 猫眼影戏 融媒体矩阵
  • 山东手机报

  • 猫眼影戏

  • 公共网官方微信

  • 公共网官方微博

  • 抖音

  • 人民号

  • 天下党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

推荐系统真正「懂你」:快手团队在NeurIPS 2025提出新效果TagCF

2025-12-04 06:11:59
泉源:

猫眼影戏

作者:

李彦琴

手机审查

  猫眼影戏记者 普利尼 报道Q8X2R7L1T4J5M9B6W3

天天 ,推荐系统都在捕获我们的兴趣与偏好。从刷过的视频到停留的直播间 ,算法总是聚焦在「内容」的明确上 ,推断用户喜欢哪类视频、哪种话题 ,善于在「内容层」识别用户喜欢什么 ,却很少真正明确「你是谁」。

快手消耗战略算法团队注重到了这一问题 ,他们想让推荐系统不止「会猜」 ,而是「懂你」。为填补这一缺失的建模角度 ,快手消耗战略算法团队联合快手基础大模子与应用部及武汉大学 ,提出了 TagCF 框架 ,让推荐系统从「知其然」迈向「知其以是然」。

该研究效果已被 NeurIPS 2025 吸收 ,相关代码与实验框架已周全开源 ,旨在为学术界与工业界提供一套以「明确驱动」为焦点的推荐系统要领论。

论文问题:Who You Are Matters: Bridging Topics and Social Roles via LLM-Enhanced Logical Recommendation论文: http://arxiv.org/abs/2505.10940代码: https://github.com/Code2Q/TagCF

配景和念头

用户明确:A Missing Formulation

图 2

当推荐系统通过统计模子学出两个内容之间的关联并据此举行推荐时 ,这种关联背后往往隐藏着用户角色这一「混杂因素」。如图2 所示 ,headset-symphonist-violin 的关联关系 ,实则泉源于「交响乐手」这一用户角色;在电阛阓景中 ,「啤酒-新晋奶爸-尿布」的经典案例同样印证了这一点。相比基于 ID 的古板隐式建模 ,引入user role视角让推荐系统得以更清晰地明确用户 ,从而迈向显式的可诠释推荐演进。

另一方面 ,当需要建模 topic-topic 关联时 ,自己可以将其看成 topic-role-topic 关联的效果图。这意味着引入 user role 的建模方法在逻辑上更具通用性与表达能力。这种通用的协偕行为建模 ,不但能捕获那些统计要领难以识别的弱交互 ,还能精准建模并有逻辑地突破用户的信息茧房(后文有验证)。

并且 ,团队还通过实验发明 ,基于 user role 的建模在统计意义上优于古板的 topic 建模 ,不但具备更稳固的空间 ,也能带来更显著的推荐效果提升。

综上所述 ,一个更有用的推荐系统需要有能力通过用户与物料之间的交互数据 ,学习到用户是一个什么样的人 ,并找到涉及用户角色的通用的原则性的客观逻辑纪律。

注:文章后续形貌中 user tag = user role = 用户特征 ,item tag = item topic = 兴趣点。

两个新使命

除了古板的推荐使命外 ,本研究借鉴 topic modeling 的思绪 ,为推荐系统拓展出两个新使命:

用户角色识别(User Role Identification):建模一个用户的特征、个性、社会角色、需求;其中特征包括但不限于用户直接提供的特征值(如性别和年岁)。

用户行为逻辑建模(Behavioral Logic Modeling):建模 user role 和 item topic 之间的逻辑关联图(如图3) ,可细分为 I2U 和 U2I 两个子使命:

I2U:具有某一特征(topic)的物料适合分发给什么特征(role)的用户。U2I:具有某种特征(role)的用户会希望看到什么特征(topic)的物料。

图3

解决计划

?樯杓

图4 - TagCF 主要功效?

TagCF 主要包括如下三个?椋

基于 MLLM 的视频内容明确中台:系统遍历天天新增的视频(抵达一定曝光数目后) ,使用 MLLM 模子(M3[1])对每个视频i提取多模态内容和视频 embedding ,然后通过人工设计的 prompt(图5)指导 MLLM 模子明确视频语义 ,从而自动天生响应的 item tag 与 user tag ,并实时更新标签库。

图5

基于 LLM 的行为逻辑图探索中台:在获得两种 tag 荟萃后 ,第二步就是构建 tag2tag 逻辑图 ,即 U2I 和 I2U 逻辑图。详细的 ,凭证给定的起始 tag ,我们构建对应的逻辑推理 prompt(图6) ,并通过一个 LLM(QWen2.5-7B[2])来天生对侧的目的 tag。

图6

赋能下游推荐系统:在获得内容明确的 tag 信息和 tag2tag 逻辑图后 ,下游推荐系统可以使用这些中台信息对推荐模子举行对应的增强(属 LLM-for-rec 范式 ,有别于 LLM-as-rec 范式)。为了包管建?占涞囊恢滦 ,团队提出可以单独针对 itemtag 空间或 usertag 空间举行模子增强 ,对应的计划为TagCF-it和TagCF-ut。实验验证了三个可行的推荐系统增强计划:基于 tag 的 encoder 模子增强、基于 tag-logic 对齐的训练增强和基于 tag-logic 的预估分数增强。

注:文章以为内容明确中台产出的 tag-logic 系统虽然来自于推荐系统且验证于推荐系统 ,但其具有一定通用性 ,尤其行为逻辑图也被验证有一定迁徙能力 ,未来可以为其他相关营业(如电商和搜索)赋能。

挑战和工程计划

实现历程中也保存如下挑战:无限制天生导致的 tag 荟萃无序扩张、视频笼罩率长尾漫衍、无序天生和细腻打分需求的矛盾、大模子天生效果缺乏评测手段等。

为相识决上述问题 ,文章提出了几个有用的解决计划并在线上落地:

构建弱重叠高频 tag 子集 ,即 cover set:该要领旨在自动化地提取使用效率高的 tag 子集 ,在后验视察上发明高频 tag 履历上比长尾 tag 具有更好的通用性。cover set 的构建也分为 usertag 和 itemtag 两个对称的部分 ,其历程相近 ,详细流程如下:

履历上 ,cover sets 在量级上为 7k-20k 不等 ,相比开放语义空间中的全集 ,cover sets 能够在 30 天内收敛 ,在工业场景下具有足够的稳固性和通用性 ,有利于种种下游链路的研发。

对内容明确效果举行模子蒸馏:主要目的是凭证 MLLM 和 LLM 产出的 item2tag 数据和 tag2tag 数据训练对应的蒸馏小模子 ,以便对 tag 举行细腻排序 ,对应的蒸馏模子后续在推荐历程中也会被重复使用。

人工大模子比照验证:接纳经典的 Good-Same-Bad 战略 ,从准确率、完整度、合理性和可读性等多个维度举行了人工评测。效果显示 ,该要领在效果上已能知足工业级应用需求 ,整体体现与GPT-4o靠近。

显式茧房建模和突破

基于上述三个? ,TagCF-it 模子延续兴趣点建模思绪 ,而 TagCF-ut 模子则拓展至用户角色识别与行为逻辑挖掘。至此 ,推荐系统已有能力显式地建模用户茧房并通过统计模子举行对齐。

详细的 ,团队通过学习获得的模子预估出对应的茧房内(top-20)tag 荟萃 ,记为 T(0) ,然后通过 U2I 和 I2U 逻辑图以一定 branch factor 举行发散 ,获得茧房外的 tag 荟萃 ,记为 T(1)。下图为示例:

可以显式控制的两种预预战略:

TagCF-util:仅使用T(0) ,维持茧房内特征 ,注重提升准确度。TagCF-expl:使用T(0)和T(1)的并集 ,突破茧房并举行相关新特征探索 ,注重提升多样性。

实验

离线实验

主实验在快手的 industrial 离线数据集上首先获得验证。

NDCG 和 MRR 是推荐准确率指标 ,Cover 和 Gini 是多样性指标。

实验结论:

TagCF 能有用增强 backbone 模子推荐效果。

提取的逻辑图中台可以 transfer 到其他数据集上(仅 transfer 逻辑图 ,item2tag 信息仍然需要特另外大模子推理天生和蒸馏模子对齐) ,且仍然能够提升对应 backbone 的效果。

两种 TagCF 变体泛起出差别的行为特征 ,TagCF-ut 整体准确率更好 ,TagCF-it 则更容易提升多样性。

三个增强?榈 Ablation 验证了对应?樯杓频挠杏眯。

线上实验

在研究中 ,团队举行了线上重排阶段的模子增强实验 ,其详细的 workflow 如下图:

团队举行了模子增强、训练增强和预估打分增强 ,且在打分增强阶段划分实验了 TagCF-util 和 TagCF-expl。

在实验中 ,团队发明 TagCF-expl 能够有用提升用户恒久留存指标 LT+0.037%。

别的 ,团队还视察到 ,usertag 荟萃比 itemtag 荟萃具有更强的稳固性和表达能力 ,体现在其更小的荟萃巨细、更快的收敛速率(如下表所示)以及 3.1 节所示更强的模子增强效果。这些优势意味着 ,相比兴趣点 ,用户角色是越发稳固的特征 ,越发适于推荐系统中的建模和剖析。

总结和思索

快手团队从推荐系统的「双端视角」出发 ,首次提出「视频明确与用户明确并重」的理念 ,并证实晰以用户明确为焦点的推荐系统在目今范式下的奇异优势。推荐系统的目的历来不但是「推荐内容」 ,它更关乎明确人(微观)与社会(宏观)的科学。

基于这一理念 ,团队构建了 TagCF ——包括 tag-logic 内容明确中台和推荐系统增强两个组成部分。tag-logic 内容明确中台具备强盛的可迁徙能力 ,其通用框架也可以在召回等其他链路阶段使用 ,未来可扩展至召回、电商、搜索等多营业场景;另一方面 ,推荐系统增强?榻心芰χ惫劢S没Ъ敕坎⒕傩型黄坪吞剿。

推荐系统与大模子的连系 ,正在让内容分发进入一个全新的阶段。

它能更智慧地明确用户、更精准地匹配内容 ,也带来了关于隐私、清静与公正的新思索。未来 ,团队将继续完善 tag-logic 中台系统 ,探索更高效的推理与资源使用方法。

恒久以来 ,行业主要深耕于统计模子建模路径 ,快手也相继推出了 OneRec[3] 与 GoalRank[4] 等代表性前沿手艺效果。而本文提出的显式用户明确与 tag-logic 建模要领 ,则在符号与统计两种范式之间搭起了桥梁 ,为行业带来了全新的想象空间。

更主要的是 ,tag-logic 逻辑图让系统有能力从用户的信息茧房出发 ,睁开有逻辑的语义探索——既坚持精准 ,又敢于突破。怎样在「准确」与「多样」之间找到平衡 ,正是推荐系统进化的要害命题。从「懂内容」到「懂人」 ,TagCF 的探索不但是手艺的一次跃迁 ,更是手艺贴近真实的人与社会的具象体现。

参考文献:

[1] Mu Cai, Jianwei Yang, Jianfeng Gao, and Yong Jae Lee. Proceedings of the 13th International Conference on Learning Representations, 2025.

[2] An Yang, Baosong Yang, Beichen Zhang, Binyuan Hui, Bo Zheng, Bowen Yu,Chengyuan Li, Dayiheng Liu, Fei Huang, Haoran Wei, et al. Qwen2. 5 technical report. arXiv preprint arXiv:2412.15115, 2024

[3] Zhou, Guorui, et al. "OneRec Technical Report." arXiv preprint arXiv:2506.13695 (2025).

[4] Zhang, Kaike, et al. "GoalRank: Group-Relative Optimization for a Large Ranking Model." arXiv preprint arXiv:2509.22046 (2025).

??时势1:亚洲青草一区二区综合免费在线视频

??12月04日,做好养老金融大文章 建行打造养老生态圈,

  小不点疼的小脸发白 ,撕下一截小衣服 ,裹住伤口 ,而躯体上亦是符文流转 ,止住了伤口的血。

,影音先锋今日资源。

??12月04日,冰雪下的勃勃生机——民建中央及地方组织帮扶河北丰宁纪实,

  族长石云峰喝道:“我们赶忙走 ,林虎与飞蛟的骨文造诣并不是何等精湛 ,难以真正施展祖器的威力 ,趁现在回村。”他自己有暗疾 ,不适合大动干戈。

,美女大胆一区二区,黄片视频免费观看,国产毛片精品无码更新。

??时势2:高圆百盒子所有电影

??12月04日,河南焦作一仓库发生火情 无人员伤亡,

  “至尊骨呢?”全身赤红、神辉汹涌、如血凰般的老人问道。

,精品免费看一区二区视频,wwwxxxcom,日日干日日爽。

??12月04日,国家主席习近平任免驻外大使,

  “你们这群皮猴子 ,赶忙坐下。”族长笑骂。

,中文字幕第一页线路一,美女插插插视频,色视频网站99riAV。

??时势3:永久黄色视频免费观看

??12月04日,日本横滨突发火灾 火势已蔓延至3栋住宅,

  毛球挥了挥金色的小爪子 ,那意思是 ,小事一桩 ,恶人就要云云磨。

,色色亚洲视频,A片在线无码不卡免费播,嗯~啊!轻点,出水了视频。

??12月04日,中方:正密切关注孟加拉国局势 望早日恢复社会稳定,

在村干部培训班上的讲话 篇23

,久操网AV,王者荣耀最色情的斗音,亚洲无码a片在线。

??时势4:黄色视频四区

??12月04日,深耕“地瓜经济” 浙江稳外贸稳外资走出“上扬曲线”,

  破旧的第二祖地 ,地处荒芜的边疆 ,只有那些犯了大错、惹了大祸的族人才会被发配到此。

,免费观看黄色网站入口,淫人插爽射久久久网页版,还能看的黄色网站。

??12月04日,2024年首季香港外汇基金投资赚543亿港元,

  档案法治建设是一项恒久而难题的使命 ,必需长抓不懈。不但要抓紧档案立法 ,更要抓好档案执律例则的宣传和执法检查事情。一是搞好档案系统xx普法宣布道育活动 ,认真宣传《中华人民共和国档案法》、接纳多种形式宣传《云南省档案条例》 ,一直提高全社会的档案执法意识。二是各级档案部分要深入推行档案系统行政执法责任制 ,建设健全档案执法检查事情长效机制 ,按期开展档案执法检查事情。三是认真组织好《__市档案治理条例》的立法调研 ,在学习先进蓬勃地区履历的基础上 ,普遍征求上级档案部分和全市档案事情者的意见 ,约请执法专家和学者举行论证 ,形成提交人大审议稿。

,拍自拍亚洲手机黄色视频在线观看,亚洲熟妇无码久久精品无码,大胸喷奶水WWW视频网站。

责编:冯英

审核:李黔渝

责编:怀基基

相关推荐 换一换

Copyright (C) 2001-   dzwww.com. All Rights Reserved

新闻信息效劳允许证 - 音像制品出书允许证 - 广播电视节目制作谋划允许证 - 网络视听允许证 - 网络文化谋划允许证

山东省互联网传媒集团主理  联系电话:0531-85193202  违法不良信息举报电话:0531-85196540

鲁ICP备09023866号-1   鲁公网安备 37010202000111号  

Copyright (C) 2001- Dzwww   鲁ICP备09023866号-1

网站地图