首页
闻乐 发自 凹非寺量子位 | 公众号 QbitAI
256K文本预加载提速超50%,还解锁了1M上下文窗口。
美团龙猫LongCat系列新年出招,宣布全新希罕注重力机制LoZA(LongCat ZigZag Attention)
新手艺集中火力,重点解决长文本使命的明确、算力难题。
相比于LongCat系列之前的全注重力MLA机制,LoZA只改了一半的焦点?。
但模子长文本能力从256K扩展到1M,解码速率还快了不少。
甚至比同类型的Qwen-3模子体现还要好。
接下来看详细计划。
怎样做到 “只算要害部分” ?
全注重力机制的算力瓶颈在于平方级的盘算重漂后O (L?),这导致模子在处置惩罚长文本使命时对显卡要求高,还会泛起推理延迟问题。
LoZA的焦点思绪是专注于处置惩罚主要的内容,不主要的部分少花实力。
作为LongCat系列的焦点手艺升级,LoZA主要是在原来的MLA机制上做刷新。
详细分两步。
首先,给模子里的多头潜在注重力?镸LA做一个全局“筛查”,找出哪些?榭梢员凰⑿。
在原来的MLA架构中,每个MLA?槎际谴χ贸头W⒅亓Φ慕沟愕ノ,现在的新计划是给每个?榕湟桓隹裳叭ㄖ卅。
α值越高,说明该?槎钊⒅亓ε趟阍揭,一旦简化就容易丢性能;α值越低就意味着?榈目商婊恍郧,即便换成更轻量的盘算方法,对整体的明确能力影响也不大。
在训练历程中,团队冻结模子其他参数,只更新α的梯度,通过这种专门的校准训练让模子自主学习α值,然后按α值从小到大排序,找出那些希罕化后不影响性能的MLA?,也就是后续的优化目的。
随后,将找出的50%低性能?榛怀筛嵊牧魇较:弊⒅亓SA
这样就形成了一种交织结构,团队将这种结构称为ZigZag
SSA的盘算重漂后是线性的O (L·S)(S为希罕窗口巨细,牢靠为1024Token),远低于全注重力的O (L?)。
以是这种交织结构让模子既不会由于太过简化而变笨,又能把盘算重漂后降到线性级别,省不少算力。
为了让模子在关注局部细节的基础上不忽略整体逻辑,LoZA还设计了一个1024Token希罕窗口
每个窗口里有1个认真抓整体关联的“全局块”和7个认真盯周围内容的“局部块”,单块巨细为128Token。
这样的刷新也不需要重新训练,在中期训练阶段就能完成,本钱也较量低。
从测试数据来看,LoZA的体现也不错,主要是“更快”的同时“没变笨”
速率上,要是处置惩罚128K上下文,解码速率直接比原来快10倍;
256K上下文,模子预加载(读文本历程)速率快了50%,后续解码阶段天生内容时还能省30%的算力,相当于同样的硬件,现在能同时处置惩罚两倍多的长文本使命。
这也让LongCat-Flash-Exp解锁了1M上下文窗口。
性能上,LoZA也没由于简化而缩水。
处置惩罚回覆问题、写代码这类一样平常使命时,和原版LongCat-Flash持平;处置惩罚长文本使命时,体现反而更好。
好比在MRCR测试里,反超了同样能处置惩罚1M长文本的Qwen-3模子,还更稳固。
接下来,团队还妄想让LoZA支持动态希罕比例
随笔本场景自动多用全注重力包管精度,长文本场景自动增添希罕?樘嵘,甚至适配多模态模子处置惩罚长视频、长图文内容。
好一个新年新气象!
论文地点:https://www.alphaxiv.org/abs/2512.23966
— 完 —
《少萝吃鸡巴》,《Q8X2R7L1T4J5M9B6W3》A片资源在线高清视频
“免费色哟哟网站”
久久无码专区亚洲国产精品
……
01月16日
“婷婷五月丁香综合”女子洛阳旅游订到“烂尾楼”民宿
↓↓↓
01月16日,宁波携厦门唱好“双城记” 设立跨省共建蓝碳生态碳账户,狼友视频黄色,在线妹子被操,真人破处真视频,二色aⅴ国产热
01月16日,间接带动14万亿经济产出!5G商用五年赋能千行百业 成为中国经济增长新引擎,超碰91人妻在线,亚洲色图 综合图区,孕妇变态挙交在线播放,乳爆进口
01月16日,福建南平发布地质灾害气象风险橙色预警 启动防暴雨洪水Ⅲ级应急响应,无码毛片全部免费播放欢迎您,国产小视频在线玩吊识人,BBBⅹBBBⅹⅹ,欧美XXXX色视频在线观看免费不卡
01月16日|“凡尘组合”:一个冠军的养成,天赋努力运气缺一不可|yw国产在线视频在线观看|欧美来月经时猛交|2024qq内黄群|www..com黄色电影
01月16日|年夜饭白象汤好喝高汤面走起 过中国年不能缺少仪式感|精品 区二区三区MV|色哟哟视频在线观看网址|欧美在线精品视频一区二区|992KP快乐
01月16日|天津至鄂尔多斯至三亚航线开通|亚洲理论片一区|婷婷黄色|国产精品免费AⅤ片在线播放|AA级毛片免费全部播放……
01月16日,西南岩溶国家公园创建区发现5个植物新种,99热这里只有精,敖闰免费无遮挡 视频网站,人人天天操综合网站,爱情岛论坛最新网址
01月16日,中新社记者实地探访塞尔维亚“中国桥”,91重口猎奇在线观看,一级毛片人与牲口,xxxx 18到19岁,水蜜桃一曲二曲三曲
01月16日|西延高铁控制性工程武家塬隧道全隧贯通|美女的裸体100%下载|黄色大毛逼网|精品免费久久久久久久|国产国产精品人在线观看
01月16日,广东患儿成功“换肤”切除巨型黑毛痣,激情刺激老色鬼无码精品国产,毛片a级,凝光用玉腿撑开被c到高潮漫画,糖心logo国产专区丝袜高清
01月16日,HICOOL全球创业者峰会上的黑科技,2级黄片,国产成人影院在线观看,美女黄色逼逼视频,成人大奶片
01月16日,中国航展观察:谁是“最该追的星”,中文字幕中文字幕在线,在线看片 你懂,亚洲有码一区二区三区四区,色色色碰
01月16日|湖北咸宁:贺胜鸡汤“香万里” 小镇特色产业兴|一区视频在线播放、真人黄色录像一级片|三角洲骇爪黄改版|2020国产二区三区精品|尼尔机械纪元9s2b被焯出白水
01月16日|浙江农村居民人均可支配收入突破4万元|俄罗斯乱伦XXXX|国产免费二级视频|日韩视频7cm|欧美精品视频在线观看你懂的
01月16日|2500只大熊猫雕塑亮相香港|图片小说视频|芋圆呀呀粉色碎花裙|三级理伦|XXXXHD16—HD18
全红婵哭成泪人 与陈若琳拥抱,林俊杰听到粉丝喊倒闭的反应|最新环境科学研究:农作物生长过程有效管理肥料 或可降低氨排放|九色精品视频免费观看1|免费黄色网站超碰|美女校花打开 让我 91|内射视频网站
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
胡塞武装发射导弹击中一艘美国船只 美军已确认
稀有新发现!云南这一保护区首次看到鹰雕出没宁波制造受RCEP市场青睐 三项指标创同期新高
北京亦庄“新药智造”产业高地行动已见成效
【巴黎奥运会】中国体育代表团:应对个别出现失误运动员给予理解
15国华裔青少年浙江宁波告别寻根之旅
闽籍港澳乡贤“深珠座谈会”建言资政
时习之丨重温2023年中央政治局集体学习 习近平总书记的讲话催人奋进
以政法工作现代化支撑和服务中国式现代化——习近平总书记重要指示为政法战线接续奋进指明方向
纪念东西方文化交流开拓者:探访南昌利玛窦教堂
40秒打卡:巴黎街头寻找中国元素
小 戳进 无遮挡中国
美女在线观看永久免费网址
国产一级A爱大片免费视频人与拘
久操性爱在线视频
麻豆精品永久免费视频
一级乱免费视频
www.77788.gov.cn
tianlula
无码免费毛片手机在线一
性爱做爱视频

闽公网安备 35010302000113号