首页
闻乐 发自 凹非寺量子位 | 公众号 QbitAI
256K文本预加载提速超50%,还解锁了1M上下文窗口。
美团龙猫LongCat系列新年出招,宣布全新希罕注重力机制LoZA(LongCat ZigZag Attention)
新手艺集中火力,重点解决长文本使命的明确、算力难题。
相比于LongCat系列之前的全注重力MLA机制,LoZA只改了一半的焦点?。
但模子长文本能力从256K扩展到1M,解码速率还快了不少。
甚至比同类型的Qwen-3模子体现还要好。
接下来看详细计划。
怎样做到 “只算要害部分” ?
全注重力机制的算力瓶颈在于平方级的盘算重漂后O (L?),这导致模子在处置惩罚长文本使命时对显卡要求高,还会泛起推理延迟问题。
LoZA的焦点思绪是专注于处置惩罚主要的内容,不主要的部分少花实力。
作为LongCat系列的焦点手艺升级,LoZA主要是在原来的MLA机制上做刷新。
详细分两步。
首先,给模子里的多头潜在注重力?镸LA做一个全局“筛查”,找出哪些?榭梢员凰⑿。
在原来的MLA架构中,每个MLA?槎际谴χ贸头W⒅亓Φ慕沟愕ノ,现在的新计划是给每个?榕湟桓隹裳叭ㄖ卅。
α值越高,说明该?槎钊⒅亓ε趟阍揭,一旦简化就容易丢性能;α值越低就意味着?榈目商婊恍郧,即便换成更轻量的盘算方法,对整体的明确能力影响也不大。
在训练历程中,团队冻结模子其他参数,只更新α的梯度,通过这种专门的校准训练让模子自主学习α值,然后按α值从小到大排序,找出那些希罕化后不影响性能的MLA?,也就是后续的优化目的。
随后,将找出的50%低性能?榛怀筛嵊牧魇较:弊⒅亓SA
这样就形成了一种交织结构,团队将这种结构称为ZigZag
SSA的盘算重漂后是线性的O (L·S)(S为希罕窗口巨细,牢靠为1024Token),远低于全注重力的O (L?)。
以是这种交织结构让模子既不会由于太过简化而变笨,又能把盘算重漂后降到线性级别,省不少算力。
为了让模子在关注局部细节的基础上不忽略整体逻辑,LoZA还设计了一个1024Token希罕窗口
每个窗口里有1个认真抓整体关联的“全局块”和7个认真盯周围内容的“局部块”,单块巨细为128Token。
这样的刷新也不需要重新训练,在中期训练阶段就能完成,本钱也较量低。
从测试数据来看,LoZA的体现也不错,主要是“更快”的同时“没变笨”
速率上,要是处置惩罚128K上下文,解码速率直接比原来快10倍;
256K上下文,模子预加载(读文本历程)速率快了50%,后续解码阶段天生内容时还能省30%的算力,相当于同样的硬件,现在能同时处置惩罚两倍多的长文本使命。
这也让LongCat-Flash-Exp解锁了1M上下文窗口。
性能上,LoZA也没由于简化而缩水。
处置惩罚回覆问题、写代码这类一样平常使命时,和原版LongCat-Flash持平;处置惩罚长文本使命时,体现反而更好。
好比在MRCR测试里,反超了同样能处置惩罚1M长文本的Qwen-3模子,还更稳固。
接下来,团队还妄想让LoZA支持动态希罕比例
随笔本场景自动多用全注重力包管精度,长文本场景自动增添希罕?樘嵘,甚至适配多模态模子处置惩罚长视频、长图文内容。
好一个新年新气象!
论文地点:https://www.alphaxiv.org/abs/2512.23966
— 完 —
《一级特黄a大片录像高清》,《Q8X2R7L1T4J5M9B6W3》网站色哟哟
“狂躁欧美肥臀大BBBB”
古装观看一级古装A片
……
01月14日
“后营露营未删减”药明康德转融券融出量激增30倍
↓↓↓
01月14日,(新春走基层)江苏徐州地标美食“坐”上高铁诚邀天下客,亚洲欧美人妻性爱视频,亚洲欧美色图区,日本视频wwwww色,三级全黄片美女全裸
01月14日,一季度京津冀地区外贸规模创历史同期新高,黄片子无码在线国产,XXNX中国 69,日批网站,igao‘com’
01月14日,伊朗最高领袖首次回应以色列袭击,久久亚洲欧美国产精品,18+哔咔下载免费,亚洲永久精品福利视频导航,甘雨被塞进里面挤奶视频
01月14日|【东西问】金庸诞辰百年 浙大教授忆共事6年经历|让男人疯狂捣白浆|日韩专区亚洲图片一区二区|国产无码乱伦精品一区|国产av天堂久久久久
01月14日|北京八达岭夜长城将于春节期间开放|国产精品第一二三区久久|美女打开双腿扒开尿口免费视频|红桃色情视频|极品美女被中出喷水
01月14日|维也纳铜管三重奏首次来华演出 北京音乐厅首站掀起“金色热潮”|国产男操女18禁在线免费观看|华人网站一级毛片|男人网站在线观看网站不卡|国产精品久久久久国产妓女……
01月14日,证监会:扎实推进北京证券交易所债券市场建设,搞鸡,影院理仑片电影在线观看免费版,高清 码 在线观看,桃阁阁网站入口
01月14日,《中国我的爱》MV正式上线,黄色网站免费永久入口,26uuu欧美亚洲日韩另类,曰批全过程免费视频在线观看,18岁黄色视频
01月14日|广西民警节前不停歇 日夜守护中国“南大门”|香蕉涩漫|免费在线观看日韩黄片|大龟慢慢挺进妈妈身体里|男生把困困塞女生困困
01月14日,青年台商组团参访吉林:遇见“新农业”冀拓新市场,在线免费看的Av网站,3344永久在线观看免费,亚洲性爱插免费视频,偷拍欧美熟女干妞
01月14日,国家知识产权局:助力培育国货“潮品” 坚决打击各种傍名牌、蹭热点行为,欧美人与动交视频在线观看,无尽 白丝 动漫,鲁大师在线观看在线播放八戒,亚洲免费视频二
01月14日,一站一景、站城融合 集大原高铁三座车站落成,免费人成黄页网站在线观看国际,在线播放www一区二区三区,国产久拍精品,绿帽论坛
01月14日|日本大选投票开始 执政联盟席位能否过半成焦点|神里绫华疯狂被 喷水自慰|国产黄色骚视频|免费观看A级黄色片|欧美黑人啪啪大猛爽
01月14日|最高检:前三季度起诉电信网络诈骗犯罪4.7万余人|亚州一级黄色视频|mama31别告诉妈妈|亚洲一区二区三区中文字幕一本|黄色毛片网站国产
01月14日|广西平果哈嘹足球队赴文莱参加友谊赛 足球为媒促人文交流|高清 码|手机A片色色|日本色情网址|俄罗斯美女换爱游戏
王昶梁伟铿男双决赛,月经3天和7天均属正常|游戏产业成毕业生就业“香饽饽”|放进 里|、一级黄色网站毛片|国产鲁鲁精在线观看|久久精品国产96久久久
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
海南春节旅游热潮已现,环岛租车自驾游带来新体验
国家铁路局:推动实现货物运输"宜铁则铁",促进降低物流成本
2024“讲好中国故事”创意传播国际大赛“一带一路”主题赛启动
湖南省人民检察院依法对李武宁决定逮捕
威廉·透纳、拉斐尔前派绘画作品汇聚国家大剧院
日媒:日本高滨核电站发生水蒸气泄漏
2023年北京新设外资企业同比增长超两成
京津冀协同创新指数年均增速12.9%
(巴黎残奥会)探访巴黎残奥村:奥运村的完美“转身”
更快步伐实现广佛都市圈硬联通
国语对白一级毛片在线视频
人人操人人狠人人擦
男人进女人下部全黄大色视频
色伊人
色视网站
欧美淫贱视频
男人把自己的坤坤放在女人的嘴里
老头在妓女体内谢精子
迪丽热巴自慰 喷水好
大菠萝福建导航

闽公网安备 35010302000113号