猫眼影戏
猫眼影戏
马升昌
手机审查
猫眼影戏记者 龙梅 报道Q8X2R7L1T4J5M9B6W3
闻乐 发自 凹非寺量子位 | 公众号 QbitAI
256K文本预加载提速超50%,还解锁了1M上下文窗口。
美团龙猫LongCat系列新年出招,宣布全新希罕注重力机制LoZA(LongCat ZigZag Attention)
新手艺集中火力,重点解决长文本使命的明确、算力难题。
相比于LongCat系列之前的全注重力MLA机制,LoZA只改了一半的焦点?。
但模子长文本能力从256K扩展到1M,解码速率还快了不少。
甚至比同类型的Qwen-3模子体现还要好。
接下来看详细计划。
怎样做到 “只算要害部分” ?
全注重力机制的算力瓶颈在于平方级的盘算重漂后O (L?),这导致模子在处置惩罚长文本使命时对显卡要求高,还会泛起推理延迟问题。
LoZA的焦点思绪是专注于处置惩罚主要的内容,不主要的部分少花实力。
作为LongCat系列的焦点手艺升级,LoZA主要是在原来的MLA机制上做刷新。
详细分两步。
首先,给模子里的多头潜在注重力?镸LA做一个全局“筛查”,找出哪些?榭梢员凰⑿。
在原来的MLA架构中,每个MLA?槎际谴χ贸头W⒅亓Φ慕沟愕ノ,现在的新计划是给每个?榕湟桓隹裳叭ㄖ卅。
α值越高,说明该?槎钊⒅亓ε趟阍揭,一旦简化就容易丢性能;α值越低就意味着?榈目商婊恍郧,即便换成更轻量的盘算方法,对整体的明确能力影响也不大。
在训练历程中,团队冻结模子其他参数,只更新α的梯度,通过这种专门的校准训练让模子自主学习α值,然后按α值从小到大排序,找出那些希罕化后不影响性能的MLA?,也就是后续的优化目的。
随后,将找出的50%低性能?榛怀筛嵊牧魇较:弊⒅亓SA
这样就形成了一种交织结构,团队将这种结构称为ZigZag
SSA的盘算重漂后是线性的O (L·S)(S为希罕窗口巨细,牢靠为1024Token),远低于全注重力的O (L?)。
以是这种交织结构让模子既不会由于太过简化而变笨,又能把盘算重漂后降到线性级别,省不少算力。
为了让模子在关注局部细节的基础上不忽略整体逻辑,LoZA还设计了一个1024Token希罕窗口
每个窗口里有1个认真抓整体关联的“全局块”和7个认真盯周围内容的“局部块”,单块巨细为128Token。
这样的刷新也不需要重新训练,在中期训练阶段就能完成,本钱也较量低。
从测试数据来看,LoZA的体现也不错,主要是“更快”的同时“没变笨”
速率上,要是处置惩罚128K上下文,解码速率直接比原来快10倍;
256K上下文,模子预加载(读文本历程)速率快了50%,后续解码阶段天生内容时还能省30%的算力,相当于同样的硬件,现在能同时处置惩罚两倍多的长文本使命。
这也让LongCat-Flash-Exp解锁了1M上下文窗口。
性能上,LoZA也没由于简化而缩水。
处置惩罚回覆问题、写代码这类一样平常使命时,和原版LongCat-Flash持平;处置惩罚长文本使命时,体现反而更好。
好比在MRCR测试里,反超了同样能处置惩罚1M长文本的Qwen-3模子,还更稳固。
接下来,团队还妄想让LoZA支持动态希罕比例
随笔本场景自动多用全注重力包管精度,长文本场景自动增添希罕?樘嵘,甚至适配多模态模子处置惩罚长视频、长图文内容。
好一个新年新气象!
论文地点:https://www.alphaxiv.org/abs/2512.23966
— 完 —
??时势1:国产成a人片在线观看久
??01月14日,强降雨袭珠三角 中山部分镇街道“成河”鳄鱼“出逃”,
小不点大眼光束惊人,如两团小火炬似的,体态如神鹤展翅,划出一道优美的轨迹,右臂一探,砰的一声捉住了那条晶莹的藕臂,此后猛力一带,将漂亮的女子扯了一个趔趄,身子低矮了下来。
,狼友视频在线黄片。??01月14日,紧扣推进中国式现代化(人民观点)——牢牢把握进一步全面深化改革的主题①,
“幽雨,你这次衔命出行西疆,手中一共只有八块符牌罢了,这已经是最后一块了,就这般给了这个孩子?”一位中年人问道。
,66J8在线观看视频,综合国产黄色,一区二区三区四区自拍。??时势2:B站影院全球最大库存更新时间
??01月14日,判处有期徒刑三年 李佩霞受贿案一审宣判,
??01月14日,巴基斯坦俾路支省发生多起袭击 官方称已消灭21名恐怖分子,
也正是由于云云,他才敢在百族战场射杀血脉很纯净的貔貅的幼崽。许多老辈人物都猜到了十五爷的用意,他是要用真正的貔貅真血为孙子洗礼肉身。
,在线免费观看麻豆视频,动漫美女被 到爽 流火影忍者,照片色色色视频。??时势3:国产美女激情视频网站免费
??01月14日,巴厘岛举行“Ogoh-Ogoh”游行:怪兽狂欢,
“石毅谁人小崽子身在王侯家,可调动无限资源,不会缺少远古遗种的血、稀世仙丹等,这样生长下去,确实令人悚然。”
,坤坤寒进坎坎里免费视频观看,青榴视频在线,国产精品亚洲第。??01月14日,巴西副总统阿尔克明:巴中经贸合作涌现新机遇,
“不可能,毅儿虽幼年,但却睿智而稳重,怎么可能会做这种蠢事,我想一定尚有他人。”一位宗老启齿。
,wwwwxxxx性爱,所有免费av网址,在线观看黄黄网站。??时势4:亚洲一级精品无码AV
??01月14日,得了甲流还会得乙流吗?,
“喀嚓”声时时传来,有时无意还会传来铿锵声,迸发出一串串火星,木质着实太坚硬了。
,三级片日本视频,91视频网址国产,网站18禁。??01月14日,十四届全国人大二次会议表决通过了关于政府工作报告的决议,
这究竟是谁想抢谁?众人有点精神庞杂的感受。
,射一射操一艹日一日,国产精品lululu在线观看,黄色视频下载大全。【男子与家人失散41年 湖北宜昌警方助其团圆】
责编:熊猫侠
审核:王莉
责编:弗拉基米尔·季托夫
Copyright (C) 2001- dzwww.com. All Rights Reserved
新闻信息效劳允许证 - 音像制品出书允许证 - 广播电视节目制作谋划允许证 - 网络视听允许证 - 网络文化谋划允许证
山东省互联网传媒集团主理 联系电话:0531-85193202 违法不良信息举报电话:0531-85196540
鲁ICP备09023866号-1 鲁公网安备 37010202000111号
Copyright (C) 2001- Dzwww 鲁ICP备09023866号-1