激情图区自拍偷拍,让你在休闲的每一刻都能享受极致的娱乐体验,开启属于你的快乐时光

k1体育麻将胡了

搜索 猫眼影戏 融媒体矩阵
  • 山东手机报

  • 猫眼影戏

  • 公共网官方微信

  • 公共网官方微博

  • 抖音

  • 人民号

  • 天下党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

推荐系统真正「懂你」:快手团队在NeurIPS 2025提出新效果TagCF

2025-12-04 13:32:59
泉源:

猫眼影戏

作者:

何建法

手机审查

  猫眼影戏记者 喻亚洲 报道Q8X2R7L1T4J5M9B6W3

天天,推荐系统都在捕获我们的兴趣与偏好。从刷过的视频到停留的直播间,算法总是聚焦在「内容」的明确上,推断用户喜欢哪类视频、哪种话题,善于在「内容层」识别用户喜欢什么,却很少真正明确「你是谁」。

快手消耗战略算法团队注重到了这一问题,他们想让推荐系统不止「会猜」,而是「懂你」。为填补这一缺失的建模角度,快手消耗战略算法团队联合快手基础大模子与应用部及武汉大学,提出了 TagCF 框架,让推荐系统从「知其然」迈向「知其以是然」。

该研究效果已被 NeurIPS 2025 吸收,相关代码与实验框架已周全开源,旨在为学术界与工业界提供一套以「明确驱动」为焦点的推荐系统要领论。

论文问题:Who You Are Matters: Bridging Topics and Social Roles via LLM-Enhanced Logical Recommendation论文: http://arxiv.org/abs/2505.10940代码: https://github.com/Code2Q/TagCF

配景和念头

用户明确:A Missing Formulation

图 2

当推荐系统通过统计模子学出两个内容之间的关联并据此举行推荐时,这种关联背后往往隐藏着用户角色这一「混杂因素」。如图2 所示,headset-symphonist-violin 的关联关系,实则泉源于「交响乐手」这一用户角色;在电阛阓景中,「啤酒-新晋奶爸-尿布」的经典案例同样印证了这一点。相比基于 ID 的古板隐式建模,引入user role视角让推荐系统得以更清晰地明确用户,从而迈向显式的可诠释推荐演进。

另一方面,当需要建模 topic-topic 关联时,自己可以将其看成 topic-role-topic 关联的效果图。这意味着引入 user role 的建模方法在逻辑上更具通用性与表达能力。这种通用的协偕行为建模,不但能捕获那些统计要领难以识别的弱交互,还能精准建模并有逻辑地突破用户的信息茧房(后文有验证)。

并且,团队还通过实验发明,基于 user role 的建模在统计意义上优于古板的 topic 建模,不但具备更稳固的空间,也能带来更显著的推荐效果提升。

综上所述,一个更有用的推荐系统需要有能力通过用户与物料之间的交互数据,学习到用户是一个什么样的人,并找到涉及用户角色的通用的原则性的客观逻辑纪律。

注:文章后续形貌中 user tag = user role = 用户特征,item tag = item topic = 兴趣点。

两个新使命

除了古板的推荐使命外,本研究借鉴 topic modeling 的思绪,为推荐系统拓展出两个新使命:

用户角色识别(User Role Identification):建模一个用户的特征、个性、社会角色、需求;其中特征包括但不限于用户直接提供的特征值(如性别和年岁)。

用户行为逻辑建模(Behavioral Logic Modeling):建模 user role 和 item topic 之间的逻辑关联图(如图3),可细分为 I2U 和 U2I 两个子使命:

I2U:具有某一特征(topic)的物料适合分发给什么特征(role)的用户。U2I:具有某种特征(role)的用户会希望看到什么特征(topic)的物料。

图3

解决计划

?樯杓

图4 - TagCF 主要功效?

TagCF 主要包括如下三个?椋

基于 MLLM 的视频内容明确中台:系统遍历天天新增的视频(抵达一定曝光数目后),使用 MLLM 模子(M3[1])对每个视频i提取多模态内容和视频 embedding,然后通过人工设计的 prompt(图5)指导 MLLM 模子明确视频语义,从而自动天生响应的 item tag 与 user tag,并实时更新标签库。

图5

基于 LLM 的行为逻辑图探索中台:在获得两种 tag 荟萃后,第二步就是构建 tag2tag 逻辑图,即 U2I 和 I2U 逻辑图。详细的,凭证给定的起始 tag,我们构建对应的逻辑推理 prompt(图6),并通过一个 LLM(QWen2.5-7B[2])来天生对侧的目的 tag。

图6

赋能下游推荐系统:在获得内容明确的 tag 信息和 tag2tag 逻辑图后,下游推荐系统可以使用这些中台信息对推荐模子举行对应的增强(属 LLM-for-rec 范式,有别于 LLM-as-rec 范式)。为了包管建?占涞囊恢滦,团队提出可以单独针对 itemtag 空间或 usertag 空间举行模子增强,对应的计划为TagCF-it和TagCF-ut。实验验证了三个可行的推荐系统增强计划:基于 tag 的 encoder 模子增强、基于 tag-logic 对齐的训练增强和基于 tag-logic 的预估分数增强。

注:文章以为内容明确中台产出的 tag-logic 系统虽然来自于推荐系统且验证于推荐系统,但其具有一定通用性,尤其行为逻辑图也被验证有一定迁徙能力,未来可以为其他相关营业(如电商和搜索)赋能。

挑战和工程计划

实现历程中也保存如下挑战:无限制天生导致的 tag 荟萃无序扩张、视频笼罩率长尾漫衍、无序天生和细腻打分需求的矛盾、大模子天生效果缺乏评测手段等。

为相识决上述问题,文章提出了几个有用的解决计划并在线上落地:

构建弱重叠高频 tag 子集,即 cover set:该要领旨在自动化地提取使用效率高的 tag 子集,在后验视察上发明高频 tag 履历上比长尾 tag 具有更好的通用性。cover set 的构建也分为 usertag 和 itemtag 两个对称的部分,其历程相近,详细流程如下:

履历上,cover sets 在量级上为 7k-20k 不等,相比开放语义空间中的全集,cover sets 能够在 30 天内收敛,在工业场景下具有足够的稳固性和通用性,有利于种种下游链路的研发。

对内容明确效果举行模子蒸馏:主要目的是凭证 MLLM 和 LLM 产出的 item2tag 数据和 tag2tag 数据训练对应的蒸馏小模子,以便对 tag 举行细腻排序,对应的蒸馏模子后续在推荐历程中也会被重复使用。

人工大模子比照验证:接纳经典的 Good-Same-Bad 战略,从准确率、完整度、合理性和可读性等多个维度举行了人工评测。效果显示,该要领在效果上已能知足工业级应用需求,整体体现与GPT-4o靠近。

显式茧房建模和突破

基于上述三个?,TagCF-it 模子延续兴趣点建模思绪,而 TagCF-ut 模子则拓展至用户角色识别与行为逻辑挖掘。至此,推荐系统已有能力显式地建模用户茧房并通过统计模子举行对齐。

详细的,团队通过学习获得的模子预估出对应的茧房内(top-20)tag 荟萃,记为 T(0),然后通过 U2I 和 I2U 逻辑图以一定 branch factor 举行发散,获得茧房外的 tag 荟萃,记为 T(1)。下图为示例:

可以显式控制的两种预预战略:

TagCF-util:仅使用T(0),维持茧房内特征,注重提升准确度。TagCF-expl:使用T(0)和T(1)的并集,突破茧房并举行相关新特征探索,注重提升多样性。

实验

离线实验

主实验在快手的 industrial 离线数据集上首先获得验证。

NDCG 和 MRR 是推荐准确率指标,Cover 和 Gini 是多样性指标。

实验结论:

TagCF 能有用增强 backbone 模子推荐效果。

提取的逻辑图中台可以 transfer 到其他数据集上(仅 transfer 逻辑图,item2tag 信息仍然需要特另外大模子推理天生和蒸馏模子对齐),且仍然能够提升对应 backbone 的效果。

两种 TagCF 变体泛起出差别的行为特征,TagCF-ut 整体准确率更好,TagCF-it 则更容易提升多样性。

三个增强?榈 Ablation 验证了对应?樯杓频挠杏眯。

线上实验

在研究中,团队举行了线上重排阶段的模子增强实验,其详细的 workflow 如下图:

团队举行了模子增强、训练增强和预估打分增强,且在打分增强阶段划分实验了 TagCF-util 和 TagCF-expl。

在实验中,团队发明 TagCF-expl 能够有用提升用户恒久留存指标 LT+0.037%。

别的,团队还视察到,usertag 荟萃比 itemtag 荟萃具有更强的稳固性和表达能力,体现在其更小的荟萃巨细、更快的收敛速率(如下表所示)以及 3.1 节所示更强的模子增强效果。这些优势意味着,相比兴趣点,用户角色是越发稳固的特征,越发适于推荐系统中的建模和剖析。

总结和思索

快手团队从推荐系统的「双端视角」出发,首次提出「视频明确与用户明确并重」的理念,并证实晰以用户明确为焦点的推荐系统在目今范式下的奇异优势。推荐系统的目的历来不但是「推荐内容」,它更关乎明确人(微观)与社会(宏观)的科学。

基于这一理念,团队构建了 TagCF ——包括 tag-logic 内容明确中台和推荐系统增强两个组成部分。tag-logic 内容明确中台具备强盛的可迁徙能力,其通用框架也可以在召回等其他链路阶段使用,未来可扩展至召回、电商、搜索等多营业场景;另一方面,推荐系统增强?榻心芰χ惫劢S没Ъ敕坎⒕傩型黄坪吞剿。

推荐系统与大模子的连系,正在让内容分发进入一个全新的阶段。

它能更智慧地明确用户、更精准地匹配内容,也带来了关于隐私、清静与公正的新思索。未来,团队将继续完善 tag-logic 中台系统,探索更高效的推理与资源使用方法。

恒久以来,行业主要深耕于统计模子建模路径,快手也相继推出了 OneRec[3] 与 GoalRank[4] 等代表性前沿手艺效果。而本文提出的显式用户明确与 tag-logic 建模要领,则在符号与统计两种范式之间搭起了桥梁,为行业带来了全新的想象空间。

更主要的是,tag-logic 逻辑图让系统有能力从用户的信息茧房出发,睁开有逻辑的语义探索——既坚持精准,又敢于突破。怎样在「准确」与「多样」之间找到平衡,正是推荐系统进化的要害命题。从「懂内容」到「懂人」,TagCF 的探索不但是手艺的一次跃迁,更是手艺贴近真实的人与社会的具象体现。

参考文献:

[1] Mu Cai, Jianwei Yang, Jianfeng Gao, and Yong Jae Lee. Proceedings of the 13th International Conference on Learning Representations, 2025.

[2] An Yang, Baosong Yang, Beichen Zhang, Binyuan Hui, Bo Zheng, Bowen Yu,Chengyuan Li, Dayiheng Liu, Fei Huang, Haoran Wei, et al. Qwen2. 5 technical report. arXiv preprint arXiv:2412.15115, 2024

[3] Zhou, Guorui, et al. "OneRec Technical Report." arXiv preprint arXiv:2506.13695 (2025).

[4] Zhang, Kaike, et al. "GoalRank: Group-Relative Optimization for a Large Ranking Model." arXiv preprint arXiv:2509.22046 (2025).

??时势1:av在线免

??12月04日,用心用情用力保障和改善民生(今日谈),

?刑事案件中连忙释放后犯法嫌疑人就彻底无罪了吗?,国产顶级黄色录像。

??12月04日,知名上市企业被电诈近1亿元,网友好奇发生了啥,

  “阿蛮,好熟悉,我怎么想不起来了?”小不点起劲追念,大眼睛无神的看着天花板,失去了往昔的灵动。

,久久国产色视频,惩罚女扒开 用棉签和冰块祺鑫,兔娘开户图片。

??时势2:久久天天婷婷五月开心

??12月04日,湖南:严查“游学研学”等学科类隐形变异培训,

  一、坚持治理是医院生长永恒主题

,黑哥大鸡巴视频,国产一级无码中文字幕,欧美性爱 在线观看。

??12月04日,我国最大海上智能油田群日产量创新高 海上智慧油田建设提质升级,

  一群人都跟了过来,闭上眼睛,仔细感应,此后全都惊地睁开了眼睛,绝对是一头恐怖的兽王喋血了,居然死在了这里!

,一级A片在线看无码,欧美可看黄色网站,环肥燕瘦3D漫画免费下拉。

??时势3:日韩精品第一页在线播放

??12月04日,10月28日“农产品批发价格200指数”比上周五下降0.76个点,

  严酷来说,学习骨文,不可还好,若是有成,且处在某一特殊阶段,总是动用会对身体有严重危险。

,jizzcom国产,亲亲草av在线,综合 在线 亚洲。

??12月04日,国家安全是中国式现代化行稳致远的重要基础(学习贯彻党的二十届三中全会精神),

  “族长爷爷,我知道的!”小不点认真所在头。

,绿巨人黑科技人口,日本被 到爽 奶头,激情欧美AAAA。

??时势4:穆桂英艳史理伦

??12月04日,广西力推道路交通安全综合治理 为民众出行安全保驾护航,

  4.爆发火灾时要迅速逃生,不可贪恋财物。

,一级黄片中文字幕亚州无码免费观看,免费看18禁止观看黄网站,97视频现在精品免费播放。

??12月04日,中国驻韩大使邢海明:期待与韩方一道推动两国战略合作伙伴关系向前发展,

  增强学习,强化素质,这是党委系统办公室事情职员为经济社会生长效劳的条件条件。我这里所指的学习,不但指一样平常意义上的念书学习,并且有着更高的要求,详细讲,就是要做到“四个坚持”,即,坚持学习的适用性,驻足于管用、能用,全心选择学习内容,对主要的知识,尤其是政治理论,党的蹊径目的政策,要学得深,研究得透,掌握得牢,不可知足于一知半解,蜻蜓点水;坚持学习的普遍性,尽可能多地涉猎知识,拓宽视野,不强求门门精,但必需做到样样通;坚持学习的立异性,向下层和群众学习,敢于突破一些与时代生长不相顺应的事情理念和事情模式,善于用新的思绪、新的途径、新的步伐来解决办公室事情中遇到的新矛盾和新问题;坚持学习的经常性, “在事情中学习,在学习中事情”,通过坚韧不拔地受苦学习和实践磨炼,抵达张口能讲、提笔能写、遇事能办,使自己成为党委系统办公室事情的行家里手。事情中要战胜“三个误区”:一是要战胜办公室事情主要就是搞文字事情的误区,养成多思索的习惯。确实,作为一名党委办公室事情职员,具有一定的文字功底十分主要,可是,办公室的文字事情决不可知足于一样平常要求,而应该重在为向导出思绪。各人一定要养成勤于动脑、善于思索的习惯,突出“以文辅政”这一灵魂,增强政策理论学习,连系党委中心事情举行认真思索,捉住一切可使用的时间和时机,深入相识、准确掌握下层情形,力争在各方面比向导知道的更多、更详细,从较高条理和更辽阔的视野富厚和完善向导的头脑看法,使更多的文稿进入决议,施展作用,指导全局事情的开展。二是要战胜为向导效劳只能是被动效劳的误区,养成善总结的习惯。在向导身边事情,并不料味着向导让干什么就干什么,各人要化被动为自动,充分使用直接为向导效劳的优势,善于学习和总结向导的头脑要领、向导艺术,学会站在党委的高度、向导的高度、全局的高度研究和思索问题,力争在思绪上与党委事情合拍,与向导头脑同步,起劲作育自己统揽全局、高瞻远瞩、开拓立异的立体化头脑能力。三是要战胜办公室只要按部就班就不会出大问题的误区,养成重修养的习惯。各人都知道,党委办公室的每一项事情都很主要,大到办文办会,小到接个电话、收份文件、转达信息,一旦失误,往往难以填补?梢运,“办公室事情无小事”,做好办公室事情,一样需要我们掌握纪律,开拓立异,坚持详尽再详尽,周密再周密,包管党委事情的高效有序运转。因此,希望各人增强修养,严于律己,坚持头脑苏醒,坚定政治态度,起劲做一个品行高尚、无私贡献的人。

,A在线观看播放视频www,国产黄色网址免费看,天天色天天日天天干。

责编:约翰-亨森

审核:彭忠富

责编:克林顿·德梅内塞斯

相关推荐 换一换

Copyright (C) 2001-   dzwww.com. All Rights Reserved

新闻信息效劳允许证 - 音像制品出书允许证 - 广播电视节目制作谋划允许证 - 网络视听允许证 - 网络文化谋划允许证

山东省互联网传媒集团主理  联系电话:0531-85193202  违法不良信息举报电话:0531-85196540

鲁ICP备09023866号-1   鲁公网安备 37010202000111号  

Copyright (C) 2001- Dzwww   鲁ICP备09023866号-1

网站地图