首页
闻乐 发自 凹非寺量子位 | 公众号 QbitAI
256K文本预加载提速超50%,还解锁了1M上下文窗口。
美团龙猫LongCat系列新年出招,宣布全新希罕注重力机制LoZA(LongCat ZigZag Attention)
新手艺集中火力,重点解决长文本使命的明确、算力难题。
相比于LongCat系列之前的全注重力MLA机制,LoZA只改了一半的焦点?。
但模子长文本能力从256K扩展到1M,解码速率还快了不少。
甚至比同类型的Qwen-3模子体现还要好。
接下来看详细计划。
怎样做到 “只算要害部分” ?
全注重力机制的算力瓶颈在于平方级的盘算重漂后O (L?),这导致模子在处置惩罚长文本使命时对显卡要求高,还会泛起推理延迟问题。
LoZA的焦点思绪是专注于处置惩罚主要的内容,不主要的部分少花实力。
作为LongCat系列的焦点手艺升级,LoZA主要是在原来的MLA机制上做刷新。
详细分两步。
首先,给模子里的多头潜在注重力?镸LA做一个全局“筛查”,找出哪些?榭梢员凰⑿。
在原来的MLA架构中,每个MLA?槎际谴χ贸头W⒅亓Φ慕沟愕ノ,现在的新计划是给每个?榕湟桓隹裳叭ㄖ卅。
α值越高,说明该?槎钊⒅亓ε趟阍揭,一旦简化就容易丢性能;α值越低就意味着?榈目商婊恍郧,即便换成更轻量的盘算方法,对整体的明确能力影响也不大。
在训练历程中,团队冻结模子其他参数,只更新α的梯度,通过这种专门的校准训练让模子自主学习α值,然后按α值从小到大排序,找出那些希罕化后不影响性能的MLA?,也就是后续的优化目的。
随后,将找出的50%低性能?榛怀筛嵊牧魇较:弊⒅亓SA
这样就形成了一种交织结构,团队将这种结构称为ZigZag
SSA的盘算重漂后是线性的O (L·S)(S为希罕窗口巨细,牢靠为1024Token),远低于全注重力的O (L?)。
以是这种交织结构让模子既不会由于太过简化而变笨,又能把盘算重漂后降到线性级别,省不少算力。
为了让模子在关注局部细节的基础上不忽略整体逻辑,LoZA还设计了一个1024Token希罕窗口
每个窗口里有1个认真抓整体关联的“全局块”和7个认真盯周围内容的“局部块”,单块巨细为128Token。
这样的刷新也不需要重新训练,在中期训练阶段就能完成,本钱也较量低。
从测试数据来看,LoZA的体现也不错,主要是“更快”的同时“没变笨”
速率上,要是处置惩罚128K上下文,解码速率直接比原来快10倍;
256K上下文,模子预加载(读文本历程)速率快了50%,后续解码阶段天生内容时还能省30%的算力,相当于同样的硬件,现在能同时处置惩罚两倍多的长文本使命。
这也让LongCat-Flash-Exp解锁了1M上下文窗口。
性能上,LoZA也没由于简化而缩水。
处置惩罚回覆问题、写代码这类一样平常使命时,和原版LongCat-Flash持平;处置惩罚长文本使命时,体现反而更好。
好比在MRCR测试里,反超了同样能处置惩罚1M长文本的Qwen-3模子,还更稳固。
接下来,团队还妄想让LoZA支持动态希罕比例
随笔本场景自动多用全注重力包管精度,长文本场景自动增添希罕?樘嵘,甚至适配多模态模子处置惩罚长视频、长图文内容。
好一个新年新气象!
论文地点:https://www.alphaxiv.org/abs/2512.23966
— 完 —
《免费看裸体 网站视频》,《Q8X2R7L1T4J5M9B6W3》人妻性论坛
“台湾GV空少被猛男GAY”
免费大黄无码A片在线观看
……
01月18日
“欧美激情性”中国健儿与国旗同框有多燃
↓↓↓
01月18日,中国科学院第七届科学节:仿生机器鱼、棋类机器人演示受瞩目,亚洲操屄视频,涩涩色中文综合亚洲,国产美女裸体的视频网站,无码乱伦一区二区
01月18日,什么是“新清史”?我们为什么说“新清史”是错误的?|“正道”专栏之①,美女啊啊毛片网站在线看,永久免费A级网站,日韩国产欧美精品,观看美女扒开下面猛操的网站
01月18日,无声世界的“追梦人”:“95后”听障小伙用双手传承千年窑火,粉嫩小泬无套白浆流出,男人天堂www在线观看,国产一精品一aⅴ一免费,日本XXXXHD老师学生
01月18日|台湾9月景气灯号亮黄红灯 分数降至近6个月新低|白鹿变态蕾丝超薄开档连身袜|91久久精品无码一区二区免费|苍月奥特曼网站入口|人人添人人妻欢乐爽视频
01月18日|中方欢迎伊巴关系改善取得积极进展|又爽又色高潮视频国产网站|六位少妇按摩精油按摩|女生扣逼抠到爆|羞羞视频网
01月18日|从严纠治破坏营商环境作风问题|搞黄色网站在线观看|嗯啊美女舒服手机在线视频|成欢阁官网登录入口2025|刘亦菲AAAA片免费播放……
01月18日,“五一”假期逢火箭发射,海南文昌航天旅游火热,国产精品2018不卡在线观看,人人摸人人草人人搞,99久久国产一级特片无码,学生妹人人操人人摸
01月18日,东西问·两岸“名”迹|在福州回望严复:两岸渊源深,欧美熟妇丰满肥白大屁股,97人妻天天操夜夜操,美女黄色频道网站a视频在线播放观看,小南被按着c到喷射白色液体
01月18日|倪永杰:岛内不满民进党的声音不会削弱 大陆应保持战略定力|国产91在线最新永久地址|717理论永久免费视频观看|崩铁花火被开拓者超|日本熟妇乄╳乄日本老妇mp3
01月18日,香港“盂兰文化节”开幕 体验潮式节日传统文化,草莓视频成人,黄色仓库hacknet2024,国内外人人操人人色,人人摸人人看人人色
01月18日,浙江:用历史文化让美丽城镇更具韵味,毛片官方网站,黄色视频在线免费看www.,国产高清一级A片视频在线,色五月天.COM
01月18日,一处考点2000多人次替考 任何舞弊都要“零容忍”,中文字欧美成,美女光屁屁18禁灌肠济,联秩闪图相册,黄片视频3级
01月18日|“免费”服务背后藏着“额外”陷阱 |3344e国产在线观看|蜜桃 免费|尼尔机械纪元9s2b被焯出白水|久操 精品视频免费在线观看
01月18日|巴斯文化国际交流大会在福州举办 巴斯公益联盟启动|欧洲免费视频在线观看|国产精品综合网在线|可以免费看的黄视频网址|羞羞漫画永久的网址
01月18日|稻香虾肥:吉林科研团队助小龙虾寒地安家惠农|天天操天天日天天做|黄色影视免费看|在线国产情|亚洲第一无码一区最新
如何评价迷宫饭第二话,美甲走起|以铸牢中华民族共同体意识为根本方向,持续深化民族团结进步创建工作|黄色网站不卡|在线看av在线不卡|三级片2021|欧美三级在线播放线观看中文
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
王沪宁看望参加全国政协十四届二次会议宣传报道的新闻工作者代表
“宝总”的台湾“24小时”,掀起两岸民间交流小高潮
浙江丽水:津巴布韦“洋弟子”寻访中国传统文化
台媒称大陆“乘虚而入”促成瑙鲁与台“断交” 外交部驳斥
台湾师生西安行:品悟学府的“年轮”与“新枝”
横琴印发文旅产业发展扶持办法申报指南
首批交通物流降本提质增效交通强国专项试点任务名单公布
你好 法国
世界最大跨度三塔斜拉桥南主塔封顶
“桃芝”袭扰香港 市民平静应对
永久免费 视频
国产免费不卡在线观看AV
色偷偷亚洲
japaneseds成人在线电影
国产精品亚洲综合一区二
波多野结衣无码一区
黑人操穴视频
搜同2025大陆证书入口
雷电将军 自慰喷水
caopo草棚国产超碰

闽公网安备 35010302000113号