首页
就现在,GitHub已经能完整看到马斯克开源的推荐算法辖档退。
开源文件里明确体现,这是一个险些完全由AI模子驱动的算法系统。
我们移除了所有人工设计特征和绝大大都启发式规则。
新闻一出,整个社区连忙欢喜了,最高赞上去就是一顿猛夸:
incredible!没有其他平台能做到云云透明。
马斯克自己也迅速转发了工程团队原帖,不过一直言辞高调的老马,此番却低调体现:
我们知道这个算法很蠢(dumb),需要大幅刷新,但至少您可以实时、透明地看到我们为刷新它而起劲。其他社交媒体公司都没有这样做。
早在2022年收购(原Twitter)之前,马斯克就多次品评该平台过于关闭。
自收购之后,他也兑现允许多次果真Twitter焦点推荐算法,这一次也算是不忘初心了。
原来纯AI驱动的推荐系统,是这样运作的!
话未几说,咱这就扒一扒整套系统的运作机制。
一句话归纳综合这个系统即为:
基于Grok-1同款Transformer架构打造,能通过学习你的历史互动行为(点赞/回复/转发过什么),来决议给你推荐什么内容。
从用户翻开“For You”最先,客户端会向效劳器发送一个请求,触发整个算法流程。
然后系统会先做一件事——搞清晰你是谁、你最近在干什么、你平时对什么内容有反应。
为实现这一目的,系统会拉取两类用户信息:
行为序列(Action Sequence):一类代表最直接、最强烈的兴趣信号,好比最近点赞、回复、转发、点进、停留过什么。属性(Features):另一类代表恒久属性,好比关注列表、声明的兴趣主题、地理位置、使用装备等。
这一步的目的并不是人工结构特征,而是尽可能真实地构建“实时用户画像”——
以前工程师可能会假设“某些属性很主要”,然后手动编写规则或公式去盘算一个“用户兴趣得分”。
但这实质上是工程师的意料,而非用户真实状态的反应。
于是马斯克的这套算法就决议不做任何预设假设,而是尽可能多地、原始地网络用户最真实的行为反应,然后将这堆数据直接喂给后续的模子,从而让模子自己去从原始数据中学习和发明纪律。(即“去人工化”和“端到端”)
而拿到实时用户画像后,系统会接着兵分两路,从整个平台的海量推文中快速筛选出几千条“可能相关”的推文。
一条是通过熟人圈。即从Thunder?,直接抓取你关注的所有人的最新推文。
另一条是通过外部。使用Phoenix Retrieval这一焦点检索?,抓取那些你可能感兴趣、但来自未关注账号的推文。
以上两类泉源差别的信息,会在后续阶段被统一看待。
需要提醒,此时筛选出来的还只是推文ID。
于是系统会通过Hydration?,补全每条候选推文的信息,包括推文全文、作者详情、图片/视频、历史互动数据等,以便后续深度评估。
并且在正式最先盘算前,还会进一步通过Filtering?轱蕴切┫宰挪灰哪谌,例如:
重复或逾期的帖子用户自己宣布的内容来自拉黑或静音账号的帖子包括用户屏障要害词的内容已经看过或在目今会话中展示过的帖子用户无权限会见的订阅内容
记着,这一步只做一件事:回覆某条内容“能不可泛起,而不是值不值得推荐”。
铺垫到这里,最终剩下来的内容会被逐条送入Phoenix排序模子举行打分。
这个模子是一个基于Transformer的模子,它会同时吸收:
用户的行为序列与属性信息单条候选帖子的内容与作者信息
然后模子会展望用户对某条推文执行州操作的概率,并将种种概率凭证预设权重举行加权组合(如点赞类正向行为加分、拉黑类负向行为减分),并形成最终排序分数。
基于此,系统还会举行少量工程层面的调理——
好比控制作者多样性,阻止简单账号在信息流中占有过高比例(避免某一大V刷屏)。
这里也需要提醒,为了包管送入的每条帖子都是自力评分的,以是系统还特意设置了“不允许候选帖子相互望见”(推文之间没有交织注重力机制)。
所有候选帖子按最终得分排序,系统从中选出Top-K条帖子,作为本次请求的推荐效果。
并且在返回客户端之前,系统还会举行最后一轮校验,确保内容切合平台清静规范——
例如,移除任何已删除、被标记为垃圾信息或包括暴力血腥等违规内容的推文。
最终,履历重重筛选后的信息会凭证分数崎岖,依次展示给客户端用户。
总结下来,这套系统能够乐成运转的五大概害在于(官方划重点版):
(1)纯数据驱动,拒绝人工规则。
彻底摒弃人工界说“什么内容算好”的重大规则,改由AI模子直接从原始用户数据中学习。
(2)接纳候选隔离机制,自力评分。
AI模子在给内容打分时,每条内容“看不见”其他候选内容,只能看到用户信息。这确保了每条帖子的分数不会由于同批次其他帖子而转变,分数一致且可高效缓存复用。
(3)哈希嵌入,实现高效检索。
检索和排序都使用多个哈希函数举行向量嵌入查找,提高效率。
(4)展望多元行为,而非简单分数。
AI模子不直接输出一个模糊的“推荐值”,而是对多种用户行为同时展望。
(5)?榛魉,支持快速迭代。
整个推荐系统接纳?榛杓,各个组件可以自力开发、测试、替换。
“是的,这算法太烂了”
不过,虽然众人对老马开源的姿态表达了赞赏,但怎样这套算法照旧有一些“缺陷”。
有网友就在推荐算法开源后吐槽道:
由于API会见受限且本钱高昂,现在屏障列表的做法已经很少见了,但以前这种做法很是普遍。算法必需让较旧的屏障列表随着时间推移而逐渐消逝,这样这些较旧的屏障列表就不会再被恶意使用。
言下之意是,算法代码显示“被大宗用户屏障”是一个强负面信号,会直接导致账号被“降权”,即内容更难获得推荐,但代码中没有明确看到针对“屏障”信号的时间衰减机制。
这意味着,历史上的屏障纪录可能至今仍在影响账号的推荐分数。
此番言论也引得马斯克自己现身谈论区吐槽:
是的,这算法太烂了。
但不管怎样,老马想要改变的态度已经明确——
不但已往开源、现在开源,并且接下来还会一连开源,未来每4周将重复一次开源更新。
开源客栈:https://github.com/xai-org/x-algorithm
《黄色一级Av毛片》,《Q8X2R7L1T4J5M9B6W3》欧美色熟妇XXXXX色熟妇
“国产美女喷水1网站”
林书辞在线
……
01月26日
“性直播XXXX18liveBC”甘肃金昌两车相撞造成4死3伤
↓↓↓
01月26日,银川铁路物流中心抢运过冬“暖心煤”满足地区用煤需求,亚洲熟女综合一区二区,无码h片在线观看网址,黄色网站免费15,亚洲嫩草
01月26日,文化和旅游部发布2024年第二批旅游市场秩序整治典型案例,中文字幕在线网页播放,馃憴馃憴馃憴馃崒馃崒,我的小逼想被男人日免费视频,免费无码久久影视精品
01月26日,一批优质科研空间在河套深圳园区集中竣工,欧美日韩中文亚洲v在线综合,色先锋久久a∨资源部,国产变态www,玖玖性爱视频
01月26日|2024第八届“多彩贵州”自行车联赛收官|AV网站谁有|91污下载|超碰在线观看午夜|被 下部 羞羞麻豆
01月26日|国家粮食和物资储备局:做好雨雪冰冻灾害防范应对工作|18岁禁看黄色视频|精品 国内|千仞雪本子|欧美日韩亚洲中文字幕巨乳顶级中文字幕
01月26日|(新春走基层)德庆央宗:夫妻同心“编织”最美之家|黄色视频黄片|A片一级做二级做免费观看|18岁以下禁止下载软件|免费毛片电影……
01月26日,上海专家课题组把成果带进新疆 让“无限风光”更精准“智慧发电”,欧美老熟女性生活,继夫天天吃我奶躁我的在线观看,黄色网站一级在线观看网站,色色色色视频色
01月26日,最高检发布第五十三批指导性案例,张元英 吸乳自慰,国产福利片网站,亚洲一级黄片D∨D,白妇大战黑鬼一区二区三区
01月26日|江苏无锡首条市域轨道交通S1线开通|免费观看毛片|乌克兰少女天体营|想要xx.com|失禁+抹春药+哭喊+刺激忘羡
01月26日,重庆客运段乘务员集中进行礼仪培训备战春运,啊啊啊太粗了插我操我受不了了我要群p,巨大 房乳 流牛奶 免费,寂寞少妇被摸高朝,黄瓜视频在线观看下载
01月26日,台湾“首来族”青年:要把宝贵的交流经验带回台湾,我要看国产一级黄片,漫 视频晚,人人干人人操人人谢,欧美精品三区在线观看
01月26日,吉尔吉斯斯坦外交部:与塔吉克斯坦的边界划定工作已完成九成,免费看人成视频的网站,免费精品黄片,天天狠天天插天天透,国产在线干
01月26日|粤港澳大湾区中学生历史知识邀请赛澳门开赛|国产乱辈通奷免费视频|偷看美女洗澡一级毛片|18xxoo|直接可以免费看的爱爱视频网站
01月26日|家电企业跨界机器人赛道蔚然成风 人形机器人成焦点|日日夜夜操屄|色哟色哟网站|色77在线观看无码视频|涩谷果步爆乳无码aⅴ一区二区
01月26日|最高人民法院发布继承纠纷典型案例(第一批)|91黄色国产|99久久免费国产精品特黄|玖玖无码视频|ACG糖漫画汉化组官网入口
T1对战GEN,英国635斤男子去世 埋葬需两块墓地|云南镇雄山体滑坡:搜寻到10名失联人员|三个医生捆着躁我一晚上|一级黄色18毛片|日逼黄色视频酷酷|福利免费视频播放
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
国际识局:韩国政局突变,总统为何难逃“青瓦台魔咒”?
《二十四节气七十二候》系列高清视频:立夏
多地降水量破4月历史纪录,华南的雨还要下多久?
强降雨持续影响南方多地 各地积极应对
车厘子价格“大跳水” 年节前夕成进口水果批发市场上“销冠”
李家超携香港特区政府两名新任局长会见媒体
新春的牵挂
青海“非遗大集”系列活动在西宁启动
【中新画报】歘歘歘!全明星“天团”炫舞长空
白鹭蹁跹新疆铁门关市黄水渠湿地
欧美11一12娇小XXXX
操淫妇骚逼屁眼
天天日天天射黄片
欧美人妖
老肥熟多毛多水视频
一级黄色,平台
欧美性爱淫荡视频在线播放
美女在线观看永久免费网址
性爱视频免费一区
张婉莹操逼视频

闽公网安备 35010302000113号