首页
闻乐 发自 凹非寺量子位 | 公众号 QbitAI
256K文本预加载提速超50%,还解锁了1M上下文窗口。
美团龙猫LongCat系列新年出招,宣布全新希罕注重力机制LoZA(LongCat ZigZag Attention)
新手艺集中火力,重点解决长文本使命的明确、算力难题。
相比于LongCat系列之前的全注重力MLA机制,LoZA只改了一半的焦点?。
但模子长文本能力从256K扩展到1M,解码速率还快了不少。
甚至比同类型的Qwen-3模子体现还要好。
接下来看详细计划。
怎样做到 “只算要害部分” ?
全注重力机制的算力瓶颈在于平方级的盘算重漂后O (L?),这导致模子在处置惩罚长文本使命时对显卡要求高,还会泛起推理延迟问题。
LoZA的焦点思绪是专注于处置惩罚主要的内容,不主要的部分少花实力。
作为LongCat系列的焦点手艺升级,LoZA主要是在原来的MLA机制上做刷新。
详细分两步。
首先,给模子里的多头潜在注重力?镸LA做一个全局“筛查”,找出哪些?榭梢员凰⑿。
在原来的MLA架构中,每个MLA?槎际谴χ贸头W⒅亓Φ慕沟愕ノ,现在的新计划是给每个?榕湟桓隹裳叭ㄖ卅。
α值越高,说明该?槎钊⒅亓ε趟阍揭,一旦简化就容易丢性能;α值越低就意味着?榈目商婊恍郧,即便换成更轻量的盘算方法,对整体的明确能力影响也不大。
在训练历程中,团队冻结模子其他参数,只更新α的梯度,通过这种专门的校准训练让模子自主学习α值,然后按α值从小到大排序,找出那些希罕化后不影响性能的MLA?,也就是后续的优化目的。
随后,将找出的50%低性能?榛怀筛嵊牧魇较:弊⒅亓SA
这样就形成了一种交织结构,团队将这种结构称为ZigZag
SSA的盘算重漂后是线性的O (L·S)(S为希罕窗口巨细,牢靠为1024Token),远低于全注重力的O (L?)。
以是这种交织结构让模子既不会由于太过简化而变笨,又能把盘算重漂后降到线性级别,省不少算力。
为了让模子在关注局部细节的基础上不忽略整体逻辑,LoZA还设计了一个1024Token希罕窗口
每个窗口里有1个认真抓整体关联的“全局块”和7个认真盯周围内容的“局部块”,单块巨细为128Token。
这样的刷新也不需要重新训练,在中期训练阶段就能完成,本钱也较量低。
从测试数据来看,LoZA的体现也不错,主要是“更快”的同时“没变笨”
速率上,要是处置惩罚128K上下文,解码速率直接比原来快10倍;
256K上下文,模子预加载(读文本历程)速率快了50%,后续解码阶段天生内容时还能省30%的算力,相当于同样的硬件,现在能同时处置惩罚两倍多的长文本使命。
这也让LongCat-Flash-Exp解锁了1M上下文窗口。
性能上,LoZA也没由于简化而缩水。
处置惩罚回覆问题、写代码这类一样平常使命时,和原版LongCat-Flash持平;处置惩罚长文本使命时,体现反而更好。
好比在MRCR测试里,反超了同样能处置惩罚1M长文本的Qwen-3模子,还更稳固。
接下来,团队还妄想让LoZA支持动态希罕比例
随笔本场景自动多用全注重力包管精度,长文本场景自动增添希罕?樘嵘,甚至适配多模态模子处置惩罚长视频、长图文内容。
好一个新年新气象!
论文地点:https://www.alphaxiv.org/abs/2512.23966
— 完 —
《wwwav天堂在线》,《Q8X2R7L1T4J5M9B6W3》雷神将军被 吸乳羞羞图片
“偷拍亚洲一区一区二区三区”
最新黄色网址久久
……
01月15日
“高中女生破处网站”大梦归离
↓↓↓
01月15日,“东北很冷 喜剧很暖”,国产黄色无码一级视频,操逼bbw,国产aw无码片毛片一级,在线看男女AV免费网址不卡
01月15日,【趣解廿四时】立夏“斗蛋” 你童年的夏日游戏是什么?古巴宣布对持普通护照中国公民实施入境免签,2020国产精品视频,五十六十熟妇性视频,欧洲尤物美女性爱精点视频免费看,黄色一级片在线视频
01月15日,宁夏农垦集团有限公司原党委书记张戈接受审查调查 ,刺激黄页视频,亚洲一区二区在线观看日韩,艹干天天,三级片免费视频网址
01月15日|河北青年志愿者:让志愿精神点亮青春之光|在线视频 你懂|少妇疯狂性爱泛滥|久久免费操|攻被保镖狂C呻吟爆汁bl
01月15日|新疆夏嘎乐团:更多人感受原生态音乐的魅力|扒开 让我草|哟哟哟 色综合网|最新AV永久免费网站入口|欧美体内she精视频在线观看
01月15日|习近平致电祝贺丹麦国王腓特烈十世即位|在线综合小说图片|日韩精品资源|国产精品自拍观看|欧美亚洲综合另类色多多……
01月15日,台湾建筑师扎根福建乡村 两岸携手古村落焕新颜,无码专区丝袜日韩精品,免费操B片,精品国产在福利,二级AV网站
01月15日,黑龙江伊春森工集团有限责任公司原党委书记、董事长李忠培被开除党籍和公职,五区三级黄片视频,免费看视频毛片,国产黄色精品网站,玖玖玖玖在线视频
01月15日|进一步提升互联互通机制效能 债券通公司服务费拟下调60%|秘密入口专属官网发布页|性爱片网|贝尔摩德摸着腹部凸起的硬包欧美导航|馃崒馃崒馃崙馃崙馃崙
01月15日,法国豫园灯会正式拉开中法建交60周年庆祝活动序幕,我的图书馆女友在线观看免费,亚洲黄色三级片,亚洲中文久久精品无吗站,国产一区二区欧美
01月15日,三场小组赛一球未进,国足亚洲杯出线希望渺茫,欧美a∨成人久久久,亚洲午夜福利未满十八勿进,一级影视在线,亚洲Av无码天堂一区二区三区
01月15日,山西长治:卡通“消防螭吻”“救援螭吻”今起代言“火焰蓝”,囯内黄色视频,日本美女黄色网站,一级毛片A免费无线播,制服丝袜专区
01月15日|外贸企业持续享惠 北京海关累计签发RCEP原产地证书近万份|91夜夜揉人人捏人人添红杏|男人的🍌伸到🍑里漫画|1级黄色视频|国产高清无码强奸视频网址
01月15日|巴黎奥运会中国队首金获得者盛李豪等被记大功|66在线视频免费|久久人妻精品99|欧美日韩一区二区三区色综合|性爽交刺激视频在线
01月15日|【湾区青年说】澳门青年周少杰营造“寻味”湾区新天地|黄污视频网站免费|馃憴馃憼馃崋|欧美亚洲中文|sm调教室捆绑白丝口球
蛇年春晚吉祥物正式公布,刘雯吊带背心|“京剧第二故乡”吉林市举办京剧艺术月活动|小黄片高清无码|97超碰国产不卡在线|国产zipaiav|媚黑母猪宣言推特图片大全
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
文旅局长的“卷”也是透视地方发展的窗口
博茨瓦纳感谢南非对复活节交通事故死难、幸存者的安置
绿水青山成色更足 我国生态环境持续改善
江西今年实施省大中型项目3670个 力争年度计划完成投资1万亿元
“尺”心不改铸忠诚
香港简约公屋6月下旬接受申请
中央宣讲团在各地宣讲党的二十届三中全会精神
农业农村部:乡村建设要健全自下而上、村民自治的实施机制
“近便利”台胞服务专区厦门揭牌 台胞连称“真便利”
福建漳州开展“寻访陈元光入闽开漳文化足迹 ”主题调研采访活动
狼友视频在线播放首页
色婷婷国产精品视频
品爱阁苹果版
韩国婬欲一级毛片视频
快C我啊用力嗯轻一点图片
性爱欧美α级
黄网站免费人成再在线观看
黄色网站能看大片
青色大脑游戏下载
女人裸体秘 视频免费

闽公网安备 35010302000113号