首页
闻乐 发自 凹非寺量子位 | 公众号 QbitAI
256K文本预加载提速超50%,还解锁了1M上下文窗口。
美团龙猫LongCat系列新年出招,宣布全新希罕注重力机制LoZA(LongCat ZigZag Attention)
新手艺集中火力,重点解决长文本使命的明确、算力难题。
相比于LongCat系列之前的全注重力MLA机制,LoZA只改了一半的焦点?。
但模子长文本能力从256K扩展到1M,解码速率还快了不少。
甚至比同类型的Qwen-3模子体现还要好。
接下来看详细计划。
怎样做到 “只算要害部分” ?
全注重力机制的算力瓶颈在于平方级的盘算重漂后O (L?),这导致模子在处置惩罚长文本使命时对显卡要求高,还会泛起推理延迟问题。
LoZA的焦点思绪是专注于处置惩罚主要的内容,不主要的部分少花实力。
作为LongCat系列的焦点手艺升级,LoZA主要是在原来的MLA机制上做刷新。
详细分两步。
首先,给模子里的多头潜在注重力?镸LA做一个全局“筛查”,找出哪些?榭梢员凰⑿。
在原来的MLA架构中,每个MLA?槎际谴χ贸头W⒅亓Φ慕沟愕ノ,现在的新计划是给每个?榕湟桓隹裳叭ㄖ卅。
α值越高,说明该?槎钊⒅亓ε趟阍揭,一旦简化就容易丢性能;α值越低就意味着?榈目商婊恍郧,即便换成更轻量的盘算方法,对整体的明确能力影响也不大。
在训练历程中,团队冻结模子其他参数,只更新α的梯度,通过这种专门的校准训练让模子自主学习α值,然后按α值从小到大排序,找出那些希罕化后不影响性能的MLA?,也就是后续的优化目的。
随后,将找出的50%低性能?榛怀筛嵊牧魇较:弊⒅亓SA
这样就形成了一种交织结构,团队将这种结构称为ZigZag
SSA的盘算重漂后是线性的O (L·S)(S为希罕窗口巨细,牢靠为1024Token),远低于全注重力的O (L?)。
以是这种交织结构让模子既不会由于太过简化而变笨,又能把盘算重漂后降到线性级别,省不少算力。
为了让模子在关注局部细节的基础上不忽略整体逻辑,LoZA还设计了一个1024Token希罕窗口
每个窗口里有1个认真抓整体关联的“全局块”和7个认真盯周围内容的“局部块”,单块巨细为128Token。
这样的刷新也不需要重新训练,在中期训练阶段就能完成,本钱也较量低。
从测试数据来看,LoZA的体现也不错,主要是“更快”的同时“没变笨”
速率上,要是处置惩罚128K上下文,解码速率直接比原来快10倍;
256K上下文,模子预加载(读文本历程)速率快了50%,后续解码阶段天生内容时还能省30%的算力,相当于同样的硬件,现在能同时处置惩罚两倍多的长文本使命。
这也让LongCat-Flash-Exp解锁了1M上下文窗口。
性能上,LoZA也没由于简化而缩水。
处置惩罚回覆问题、写代码这类一样平常使命时,和原版LongCat-Flash持平;处置惩罚长文本使命时,体现反而更好。
好比在MRCR测试里,反超了同样能处置惩罚1M长文本的Qwen-3模子,还更稳固。
接下来,团队还妄想让LoZA支持动态希罕比例
随笔本场景自动多用全注重力包管精度,长文本场景自动增添希罕?樘嵘,甚至适配多模态模子处置惩罚长视频、长图文内容。
好一个新年新气象!
论文地点:https://www.alphaxiv.org/abs/2512.23966
— 完 —
《97人人添人澡人人爽超碰》,《Q8X2R7L1T4J5M9B6W3》泰国男男做爱
“浓毛少妇牲交”
欧美一级人爱视频18
……
01月14日
“清风阁A片在线网站”短剧收费乱象频发 有老年人充值4万
↓↓↓
01月14日,明日迎战世巡赛 短道速滑队渴望家门口取胜 ,原神同人动画免费观看甘雨,亚洲一区二区三区 无码,揉我胸 啊 嗯出奶了,欧美69xxxx
01月14日,2月中国汽车经销商综合库存系数同比降9.8%,久久人人妻人人做人人爽,美女一级A级视频性生,狠狠鲁成人网,欧洲免费无线码在线观看二区
01月14日,联合国官员期待中国继续引领全球可持续发展|世界观,国产极品白嫩在线观看,嗯~啊~快点 死我雏田网站,国产精品综合在线观看,中国孕交
01月14日|水利部迅速安排部署新疆阿克苏乌什县7.1级地震水利抗震救灾工作|嗯···高潮了···|亚洲 欧洲AV高清无码|国产美女羞羞网站在线观看|日日夜夜操AV
01月14日|云南西双版纳持续释放开放活力 边境村幸福和美|ww视频网站看禁🈲️片|黄色视频在线观看。|办公室吻胸胸|国产精品点击进去
01月14日|加拿大将也门胡塞武装列为“恐怖组织”|抽插硬湿紧大|国产永久免费BBw|麻豆91探花|日韩欧美中文字幕第一页……
01月14日,中柬启动“人文交流年” 两国民众期待“双向奔赴”,无码天天av,偷拍最新网址,一级做一级一级a做片性十三,娇BB嫩BBB躁BBBB
01月14日,关于马拉松那些事:跑马能“冻龄”?心率高能跑吗?,66m66成长模式视频,美女露乳头图片,国产99久久久国产精品下药,青色大脑18禁
01月14日|“2024亚洲品牌500强”榜单出炉|国产在线视频你懂的|欧美爱爱视频网|XXXXL19622222参数配置详细|蜜桃国精产品二区
01月14日,北京上演空竹大赛 港澳台地区及京津冀鲁晋豫队伍齐聚,欧美色妞干网,色一区二区三区偷拍,欧美一级,a片在线观看,我要看欧美的A片
01月14日,辽宁省贸促会率17家辽企参加2024香港国际印刷及包装展,美女少萝 爆乳 萌白酱,国产精品地址,草莓 视频旧址www在线。,69老师XXXXXXXXX学生
01月14日,交通银行黑龙江省分行国际业务部原总经理王立宪被查,看欧美一级性爱免费福利片,美国大黄片,自慰 夜香港麻豆涩漫,高圆圆雁门照
01月14日|“潭美”致海南三亚强降雨 中小学停课景区闭园|亚洲最大人成在线视频|国产最新一级视频在线观看|白A网站|女女裸体跳舞在线观看
01月14日|大湾区潮青集体骑行“向汕”迎全球潮团两大盛会|馃憴馃敒|免费A级毛片无码的看久久|韩国理论电影2021福利 717|秘密研究所发布最新版本更新内容
01月14日|外籍博主:新疆是中国通达世界的“窗口”|国产欧美一区二区精品亚洲|三级网站免费观看|美女视频网站黄的免费网站|国产在线偷怕精品
生死战国足首发:武磊张玉宁领衔,孙颖莎夺世界杯女单冠军|第37届法国贝尔克国际风筝节揭幕 中国担任主宾国|蜜桃色情视频|亚洲AAA黄片|国风产精品秘 一区二区|www.一级av
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
香港青年实习生畅谈大湾区新型工业化机遇
中国香港代表团出征巴黎残奥会
(两会速递)郑喆轩:三星堆考古成果将“及时上新”
香港金融科技周揭幕 金管局多措并举“点亮”新航道
北京中轴线上新增打卡点:庙宇里的光影和传承
筑梦现代化 同心向未来
敦煌壁画修复师李波:每一次“大考”的身体虽苦,但内心丰盈
大熊猫国家公园四川片区拿到“户口簿”
四川成都市域(郊)铁路成德线首台盾构机始发
《黑神话:悟空》爆火 外国游戏设计师称赞中国游戏产业非常成功京港青年文化人才交流收官 吴志华:为年轻人注入文化创新的DNA
日韩玖玖焦作网
18小网站
欧洲九月天性爱黄色性爱网站
日本九九九九免费精品网
∏OPHOB1080p1080p210
激情国产亚洲网站免费
欧美性爱图综合
筋肉质の体育会系イケメン
亚洲图片综合在线
欧美乱人伦在线中文

闽公网安备 35010302000113号