Gay18 China男男,界面清爽、功能强大,专为极致体验而生

k1体育麻将胡了

搜索 猫眼影戏 融媒体矩阵
  • 山东手机报

  • 猫眼影戏

  • 公共网官方微信

  • 公共网官方微博

  • 抖音

  • 人民号

  • 天下党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

推荐系统真正「懂你」:快手团队在NeurIPS 2025提出新效果TagCF

2025-12-04 21:11:45
泉源:

猫眼影戏

作者:

郭敬明

手机审查

  猫眼影戏记者 沈元赓 报道Q8X2R7L1T4J5M9B6W3

天天 ,推荐系统都在捕获我们的兴趣与偏好 。从刷过的视频到停留的直播间 ,算法总是聚焦在「内容」的明确上 ,推断用户喜欢哪类视频、哪种话题 ,善于在「内容层」识别用户喜欢什么 ,却很少真正明确「你是谁」 。

快手消耗战略算法团队注重到了这一问题 ,他们想让推荐系统不止「会猜」 ,而是「懂你」 。为填补这一缺失的建模角度 ,快手消耗战略算法团队联合快手基础大模子与应用部及武汉大学 ,提出了 TagCF 框架 ,让推荐系统从「知其然」迈向「知其以是然」 。

该研究效果已被 NeurIPS 2025 吸收 ,相关代码与实验框架已周全开源 ,旨在为学术界与工业界提供一套以「明确驱动」为焦点的推荐系统要领论 。

论文问题:Who You Are Matters: Bridging Topics and Social Roles via LLM-Enhanced Logical Recommendation论文: http://arxiv.org/abs/2505.10940代码: https://github.com/Code2Q/TagCF

配景和念头

用户明确:A Missing Formulation

图 2

当推荐系统通过统计模子学出两个内容之间的关联并据此举行推荐时 ,这种关联背后往往隐藏着用户角色这一「混杂因素」 。如图2 所示 ,headset-symphonist-violin 的关联关系 ,实则泉源于「交响乐手」这一用户角色;在电阛阓景中 ,「啤酒-新晋奶爸-尿布」的经典案例同样印证了这一点 。相比基于 ID 的古板隐式建模 ,引入user role视角让推荐系统得以更清晰地明确用户 ,从而迈向显式的可诠释推荐演进 。

另一方面 ,当需要建模 topic-topic 关联时 ,自己可以将其看成 topic-role-topic 关联的效果图 。这意味着引入 user role 的建模方法在逻辑上更具通用性与表达能力 。这种通用的协偕行为建模 ,不但能捕获那些统计要领难以识别的弱交互 ,还能精准建模并有逻辑地突破用户的信息茧房(后文有验证) 。

并且 ,团队还通过实验发明 ,基于 user role 的建模在统计意义上优于古板的 topic 建模 ,不但具备更稳固的空间 ,也能带来更显著的推荐效果提升 。

综上所述 ,一个更有用的推荐系统需要有能力通过用户与物料之间的交互数据 ,学习到用户是一个什么样的人 ,并找到涉及用户角色的通用的原则性的客观逻辑纪律 。

注:文章后续形貌中 user tag = user role = 用户特征 ,item tag = item topic = 兴趣点 。

两个新使命

除了古板的推荐使命外 ,本研究借鉴 topic modeling 的思绪 ,为推荐系统拓展出两个新使命:

用户角色识别(User Role Identification):建模一个用户的特征、个性、社会角色、需求;其中特征包括但不限于用户直接提供的特征值(如性别和年岁) 。

用户行为逻辑建模(Behavioral Logic Modeling):建模 user role 和 item topic 之间的逻辑关联图(如图3) ,可细分为 I2U 和 U2I 两个子使命:

I2U:具有某一特征(topic)的物料适合分发给什么特征(role)的用户 。U2I:具有某种特征(role)的用户会希望看到什么特征(topic)的物料 。

图3

解决计划

模块设计

图4 - TagCF 主要功效模块

TagCF 主要包括如下三个模块:

基于 MLLM 的视频内容明确中台:系统遍历天天新增的视频(抵达一定曝光数目后) ,使用 MLLM 模子(M3[1])对每个视频i提取多模态内容和视频 embedding ,然后通过人工设计的 prompt(图5)指导 MLLM 模子明确视频语义 ,从而自动天生响应的 item tag 与 user tag ,并实时更新标签库 。

图5

基于 LLM 的行为逻辑图探索中台:在获得两种 tag 荟萃后 ,第二步就是构建 tag2tag 逻辑图 ,即 U2I 和 I2U 逻辑图 。详细的 ,凭证给定的起始 tag ,我们构建对应的逻辑推理 prompt(图6) ,并通过一个 LLM(QWen2.5-7B[2])来天生对侧的目的 tag 。

图6

赋能下游推荐系统:在获得内容明确的 tag 信息和 tag2tag 逻辑图后 ,下游推荐系统可以使用这些中台信息对推荐模子举行对应的增强(属 LLM-for-rec 范式 ,有别于 LLM-as-rec 范式) 。为了包管建模空间的一致性 ,团队提出可以单独针对 itemtag 空间或 usertag 空间举行模子增强 ,对应的计划为TagCF-it和TagCF-ut 。实验验证了三个可行的推荐系统增强计划:基于 tag 的 encoder 模子增强、基于 tag-logic 对齐的训练增强和基于 tag-logic 的预估分数增强 。

注:文章以为内容明确中台产出的 tag-logic 系统虽然来自于推荐系统且验证于推荐系统 ,但其具有一定通用性 ,尤其行为逻辑图也被验证有一定迁徙能力 ,未来可以为其他相关营业(如电商和搜索)赋能 。

挑战和工程计划

实现历程中也保存如下挑战:无限制天生导致的 tag 荟萃无序扩张、视频笼罩率长尾漫衍、无序天生和细腻打分需求的矛盾、大模子天生效果缺乏评测手段等 。

为相识决上述问题 ,文章提出了几个有用的解决计划并在线上落地:

构建弱重叠高频 tag 子集 ,即 cover set:该要领旨在自动化地提取使用效率高的 tag 子集 ,在后验视察上发明高频 tag 履历上比长尾 tag 具有更好的通用性 。cover set 的构建也分为 usertag 和 itemtag 两个对称的部分 ,其历程相近 ,详细流程如下:

履历上 ,cover sets 在量级上为 7k-20k 不等 ,相比开放语义空间中的全集 ,cover sets 能够在 30 天内收敛 ,在工业场景下具有足够的稳固性和通用性 ,有利于种种下游链路的研发 。

对内容明确效果举行模子蒸馏:主要目的是凭证 MLLM 和 LLM 产出的 item2tag 数据和 tag2tag 数据训练对应的蒸馏小模子 ,以便对 tag 举行细腻排序 ,对应的蒸馏模子后续在推荐历程中也会被重复使用 。

人工大模子比照验证:接纳经典的 Good-Same-Bad 战略 ,从准确率、完整度、合理性和可读性等多个维度举行了人工评测 。效果显示 ,该要领在效果上已能知足工业级应用需求 ,整体体现与GPT-4o靠近 。

显式茧房建模和突破

基于上述三个模块 ,TagCF-it 模子延续兴趣点建模思绪 ,而 TagCF-ut 模子则拓展至用户角色识别与行为逻辑挖掘 。至此 ,推荐系统已有能力显式地建模用户茧房并通过统计模子举行对齐 。

详细的 ,团队通过学习获得的模子预估出对应的茧房内(top-20)tag 荟萃 ,记为 T(0) ,然后通过 U2I 和 I2U 逻辑图以一定 branch factor 举行发散 ,获得茧房外的 tag 荟萃 ,记为 T(1) 。下图为示例:

可以显式控制的两种预预战略:

TagCF-util:仅使用T(0) ,维持茧房内特征 ,注重提升准确度 。TagCF-expl:使用T(0)和T(1)的并集 ,突破茧房并举行相关新特征探索 ,注重提升多样性 。

实验

离线实验

主实验在快手的 industrial 离线数据集上首先获得验证 。

NDCG 和 MRR 是推荐准确率指标 ,Cover 和 Gini 是多样性指标 。

实验结论:

TagCF 能有用增强 backbone 模子推荐效果 。

提取的逻辑图中台可以 transfer 到其他数据集上(仅 transfer 逻辑图 ,item2tag 信息仍然需要特另外大模子推理天生和蒸馏模子对齐) ,且仍然能够提升对应 backbone 的效果 。

两种 TagCF 变体泛起出差别的行为特征 ,TagCF-ut 整体准确率更好 ,TagCF-it 则更容易提升多样性 。

三个增强模块的 Ablation 验证了对应模块设计的有用性 。

线上实验

在研究中 ,团队举行了线上重排阶段的模子增强实验 ,其详细的 workflow 如下图:

团队举行了模子增强、训练增强和预估打分增强 ,且在打分增强阶段划分实验了 TagCF-util 和 TagCF-expl 。

在实验中 ,团队发明 TagCF-expl 能够有用提升用户恒久留存指标 LT+0.037% 。

别的 ,团队还视察到 ,usertag 荟萃比 itemtag 荟萃具有更强的稳固性和表达能力 ,体现在其更小的荟萃巨细、更快的收敛速率(如下表所示)以及 3.1 节所示更强的模子增强效果 。这些优势意味着 ,相比兴趣点 ,用户角色是越发稳固的特征 ,越发适于推荐系统中的建模和剖析 。

总结和思索

快手团队从推荐系统的「双端视角」出发 ,首次提出「视频明确与用户明确并重」的理念 ,并证实晰以用户明确为焦点的推荐系统在目今范式下的奇异优势 。推荐系统的目的历来不但是「推荐内容」 ,它更关乎明确人(微观)与社会(宏观)的科学 。

基于这一理念 ,团队构建了 TagCF ——包括 tag-logic 内容明确中台和推荐系统增强两个组成部分 。tag-logic 内容明确中台具备强盛的可迁徙能力 ,其通用框架也可以在召回等其他链路阶段使用 ,未来可扩展至召回、电商、搜索等多营业场景;另一方面 ,推荐系统增强模块将有能力直观建模用户茧房并举行突破和探索 。

推荐系统与大模子的连系 ,正在让内容分发进入一个全新的阶段 。

它能更智慧地明确用户、更精准地匹配内容 ,也带来了关于隐私、清静与公正的新思索 。未来 ,团队将继续完善 tag-logic 中台系统 ,探索更高效的推理与资源使用方法 。

恒久以来 ,行业主要深耕于统计模子建模路径 ,快手也相继推出了 OneRec[3] 与 GoalRank[4] 等代表性前沿手艺效果 。而本文提出的显式用户明确与 tag-logic 建模要领 ,则在符号与统计两种范式之间搭起了桥梁 ,为行业带来了全新的想象空间 。

更主要的是 ,tag-logic 逻辑图让系统有能力从用户的信息茧房出发 ,睁开有逻辑的语义探索——既坚持精准 ,又敢于突破 。怎样在「准确」与「多样」之间找到平衡 ,正是推荐系统进化的要害命题 。从「懂内容」到「懂人」 ,TagCF 的探索不但是手艺的一次跃迁 ,更是手艺贴近真实的人与社会的具象体现 。

参考文献:

[1] Mu Cai, Jianwei Yang, Jianfeng Gao, and Yong Jae Lee. Proceedings of the 13th International Conference on Learning Representations, 2025.

[2] An Yang, Baosong Yang, Beichen Zhang, Binyuan Hui, Bo Zheng, Bowen Yu,Chengyuan Li, Dayiheng Liu, Fei Huang, Haoran Wei, et al. Qwen2. 5 technical report. arXiv preprint arXiv:2412.15115, 2024

[3] Zhou, Guorui, et al. "OneRec Technical Report." arXiv preprint arXiv:2506.13695 (2025).

[4] Zhang, Kaike, et al. "GoalRank: Group-Relative Optimization for a Large Ranking Model." arXiv preprint arXiv:2509.22046 (2025).

??时势1:男男基片gay在线观看

??12月04日,贵州多地迎2024年初雪,

?京东白条到期还不上怎么办?协商还款方法有哪些?,俄罗斯性爱网 。

??12月04日,江苏无锡首条市域轨道交通S1线开通,

  “由于你还太小 ,看不清那种级数的战斗 。”柳树传音 ,混沌气弥漫 ,这个地方依然一片模糊与朦胧 。

,国产AV 无码 白丝 cos,欧美欧美性爱视频,欧美肛交观看 。

??时势2:另类图片一区二区三区

??12月04日,四川雅投发展投资集团有限公司原党委书记、董事长谭克强接受审查调查,

记者“卧底”视察偷拍装备售卖改装工业链:不法改装偷拍装备最常用到手机
,人人爽夜夜高潮夜夜高潮,91lc.com,女生趴着打光屁股打红屁屁漫画 。

??12月04日,2023年贵州GDP增长4.9% 数字经济增速保持全国前列,

  小不点被白色瀑布淹没 ,在峭壁上只留下一个凸起的白点 ,可是灵觉极强 ,感受到了; ,不过这一次他没有逃避 ,而是依附肉身硬抗 。

,看了让人下面流水的视频,欧美AA欧美电视频丁及片免费看,温碧霞被躁120分钟视频播放 。

??时势3:日本zzzwww色

??12月04日,云南镇雄山体滑坡已致20人遇难24人失联,

  另一边 ,他的妻子带着忧容 ,抱着虚弱的小不点 ,漂亮的面庞上良久未曾泛起过笑容了 。

,黄色免费插满出水的大黄片,人人摸人人看人人草,武藤兰特一级婬片A片 。

??12月04日,澳大利亚珀斯北部发生船只倾覆事故 一人遇难,

  期末考试之前 ,我们各个小组、列位同砚都确立了自己的斗争目的 ,订立了详细的赏罚步伐 。许多同砚为了实现自己的斗争目的 ,憋着一股劲 ,珍惜时间 ,勤学好问 ,你追我赶 ,奋力争先 ,许多同砚取得了前进 。陈厚斌、陈晓、王振、吴鹏、李天宇、刘艺、孙立杰、崔雪、张鹏、王书晓、杨瑞盛、陈绍康、张杰、吴瑶、潘雅欣、牟浩、张幸运、齐磊、夏玉成、荆汉、贾绍宇、韩淑慧、肖彤、任民、董胜飞、曹庆龙、董震、曹庆生、赵光瑞等同砚取得了水平纷歧的前进 ,而刘培、徐梦珍、梁兴伦、刘金燕、赵丽、王秀娟、陈金霞、史璨、王美美、张石等同砚坚持了较量高的水平 ,我们同时热切期盼耿贤博、古梦蕾、刘婷婷、张钰莹、陈宝强、崔涛、李梦楠、房金鹏、王威、唐浩、侯明娇、王安琪等同砚能够抖擞直追 ,尽快把效果遇上来 。

,黄色视频公司在线看,欧美性爱性交,日本黄色网网站 。

??时势4:下载日逼

??12月04日,西安机场进境水果指定监管场地迎来今年首批进口水果,

  同砚们 ,让我们一起起劲建设我们的平安校园 ,让我们在国旗下配合祝愿:祝愿我们天天平平安安到校 ,欢快奋兴回家 ,祝愿我们的生涯随处开满清静之花 。

,N号房免费安装安装包,亚洲 国产 欧美 日韩 另类 综合,免费看毛A片 。

??12月04日,珠江流域北江将发生特大洪水 水利部将洪水防御应急响应提升至Ⅲ级,

  小不点自然知道 ,石毅的前途注定远超凡俗 ,绚烂将照亮大地 ,那是可以想象的 。

,欧洲在线黄色播放视频,毛片黄色片,日韩二区视频 。

责编:邹进文

审核:公维金

责编:杨桦

相关推荐 换一换

Copyright (C) 2001-   dzwww.com. All Rights Reserved

新闻信息效劳允许证 - 音像制品出书允许证 - 广播电视节目制作谋划允许证 - 网络视听允许证 - 网络文化谋划允许证

山东省互联网传媒集团主理  联系电话:0531-85193202  违法不良信息举报电话:0531-85196540

鲁ICP备09023866号-1   鲁公网安备 37010202000111号  

Copyright (C) 2001- Dzwww   鲁ICP备09023866号-1

网站地图