首页
闻乐 发自 凹非寺量子位 | 公众号 QbitAI
256K文本预加载提速超50%,还解锁了1M上下文窗口。
美团龙猫LongCat系列新年出招,宣布全新希罕注重力机制LoZA(LongCat ZigZag Attention)
新手艺集中火力,重点解决长文本使命的明确、算力难题。
相比于LongCat系列之前的全注重力MLA机制,LoZA只改了一半的焦点?。
但模子长文本能力从256K扩展到1M,解码速率还快了不少。
甚至比同类型的Qwen-3模子体现还要好。
接下来看详细计划。
怎样做到 “只算要害部分” ?
全注重力机制的算力瓶颈在于平方级的盘算重漂后O (L?),这导致模子在处置惩罚长文本使命时对显卡要求高,还会泛起推理延迟问题。
LoZA的焦点思绪是专注于处置惩罚主要的内容,不主要的部分少花实力。
作为LongCat系列的焦点手艺升级,LoZA主要是在原来的MLA机制上做刷新。
详细分两步。
首先,给模子里的多头潜在注重力?镸LA做一个全局“筛查”,找出哪些?榭梢员凰⑿。
在原来的MLA架构中,每个MLA?槎际谴χ贸头W⒅亓Φ慕沟愕ノ,现在的新计划是给每个?榕湟桓隹裳叭ㄖ卅。
α值越高,说明该?槎钊⒅亓ε趟阍揭,一旦简化就容易丢性能;α值越低就意味着?榈目商婊恍郧,即便换成更轻量的盘算方法,对整体的明确能力影响也不大。
在训练历程中,团队冻结模子其他参数,只更新α的梯度,通过这种专门的校准训练让模子自主学习α值,然后按α值从小到大排序,找出那些希罕化后不影响性能的MLA?,也就是后续的优化目的。
随后,将找出的50%低性能?榛怀筛嵊牧魇较:弊⒅亓SA
这样就形成了一种交织结构,团队将这种结构称为ZigZag
SSA的盘算重漂后是线性的O (L·S)(S为希罕窗口巨细,牢靠为1024Token),远低于全注重力的O (L?)。
以是这种交织结构让模子既不会由于太过简化而变笨,又能把盘算重漂后降到线性级别,省不少算力。
为了让模子在关注局部细节的基础上不忽略整体逻辑,LoZA还设计了一个1024Token希罕窗口
每个窗口里有1个认真抓整体关联的“全局块”和7个认真盯周围内容的“局部块”,单块巨细为128Token。
这样的刷新也不需要重新训练,在中期训练阶段就能完成,本钱也较量低。
从测试数据来看,LoZA的体现也不错,主要是“更快”的同时“没变笨”
速率上,要是处置惩罚128K上下文,解码速率直接比原来快10倍;
256K上下文,模子预加载(读文本历程)速率快了50%,后续解码阶段天生内容时还能省30%的算力,相当于同样的硬件,现在能同时处置惩罚两倍多的长文本使命。
这也让LongCat-Flash-Exp解锁了1M上下文窗口。
性能上,LoZA也没由于简化而缩水。
处置惩罚回覆问题、写代码这类一样平常使命时,和原版LongCat-Flash持平;处置惩罚长文本使命时,体现反而更好。
好比在MRCR测试里,反超了同样能处置惩罚1M长文本的Qwen-3模子,还更稳固。
接下来,团队还妄想让LoZA支持动态希罕比例
随笔本场景自动多用全注重力包管精度,长文本场景自动增添希罕?樘嵘,甚至适配多模态模子处置惩罚长视频、长图文内容。
好一个新年新气象!
论文地点:https://www.alphaxiv.org/abs/2512.23966
— 完 —
《naruto18 tube雏田3D》,《Q8X2R7L1T4J5M9B6W3》鸥美大片
“亚洲欧美专区色多多”
雏田开发日记动漫免费
……
01月21日
“班花没戴套让我插了一节课”杨紫回应每年都有爆剧
↓↓↓
01月21日,卖挂历已有40多年 皇城根儿78岁“挂历金大爷”想找“继承人”,黄色操逼视频网站,欧美视频岛国86色,拳交,摁住瑜伽老师的屁股疯狂进出
01月21日,韩政府向近5000名拒不返岗医师发送吊销执照预告通知,驲屄视频,国产丰满肥熟在线观看,欧美黄色一级网站啪啪啪,男人的天堂欧美性爱
01月21日,“2024广州文化周”在欧洲友城举办,免费的久久黄网,叶山小百合与隔壁邻居,毛毛看毛片,少年白袜自慰出精Gay网站
01月21日|年味“调料”:江西乐平制作“香烟糖”迎新春|福利精品在线|内射巨乳|www.亚洲黄色网站|西施被 黄漫扒衣服
01月21日|南水北调中线引江补汉工程首台硬岩掘进机“江汉先锋号”掘进始发|欧美午夜乱色视频在线观看|黄色视频一级片性欲吗|国产丰满大乳在线视频|看日本黄色一级片
01月21日|2023年乌鲁木齐国际互换局共处理国际邮件逾740万件|国产一级性交片|久草国产在线视频|91精品国产久无码|黄色网站视频久久……
01月21日,广西深化重点领域改革 让经营主体大胆闯、放手干,秘 睌,亚洲一区毛片av网站,亚洲天堂狠狠干网,日韩AV无码精品
01月21日,上海地铁将新增18座车站试点“闸机常开门”,无码毛片一级一级的潮喷,91AV网站在线看,成年人视频黄色网站,又粗又硬又黄的毛片A片视频
01月21日|拜登宣布赦免其子!背后有哪些细节?|人妻自拍申请论坛|人人操人人超|超碰免费福利在线|国产精品综合在线
01月21日,微视频|共商共建共享,午夜福利黄色网站导航,精品人妻无码专区在线影院,老熟女小BBBBXXXX,别让妈妈知道外网
01月21日,长春:东北虎文旅专列吸睛,插插插,免费看污黄网站 在线观看,www.17.C,第一区免费在线观看
01月21日,实施“云上选海”试点“立体用海” 海南推动海洋资源高效利用,欧美特黄久久精品Aⅴ,毛茸茸妓女视频,国产精品无码小视频网站不卡,日韩女黄色网站
01月21日|“世运蓉港行”主题列车发车警惕掼蛋沉迷助长消颓之气 |黄色乱视频|www.91色 萝网站樱花在线观看|亚洲26uuu在线观看|强奸乱伦不卡视频
01月21日|辐射新疆南部五地州 南疆农副产品集散中心试运营|羞羞的乳头在线看|爱久免费在线观看视频|二级婬片日本高清视频一|男人尿路感染症状是哪些
01月21日|冒充明星账号加好友,又以涉嫌侵权行敲诈!这一犯罪团伙被捣毁|国产亚洲日韩在线a不卡|处破见红的视频mp4|亚洲色黄在线|Les纯肉视频网站XXXX动漫
监察,易烊千玺鼻梁痣|深惠城际东大区间盾构始发 粤港澳城际交通网加速建设|特级全黄久久久久久久久|欧美又黑又大又长又硬|粗黑欧美特级黄色视频|色色视频污
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
税务部门创新举措助力京津冀协同发展
“不同文明在交流互鉴中焕发出新光彩”
“双11”广东省快递包裹揽投量再创历史新高
(新春走基层)杭州面塑手艺人创“国风手办龙” 冀老手艺传新年味
南昌高新区经济运行稳中向好 今年前三季度GDP达739.4亿元
人民领袖|“古建筑守护人”习近平
韩政府重申不接受日方对独岛的主权主张
南水北调“穿黄而过” 南来的江水如何“喝”“存”“补”?
专家:云南陆军讲武堂对黄埔军校创办有重要影响
提前四个月订年夜饭算什么,有人一年前就下手了
强奸乱伦视频网不卡一二三区
呦呦无码在线观看
韩国国产色色一区二区视频
在线看片导航
巨肥人妻BwwBwwB88
三级片免费站有限公司
国产cd系列
免费视频在线导航
特级特黄特大A级毛片
在线观看黄色大视频

闽公网安备 35010302000113号