首页
闻乐 发自 凹非寺量子位 | 公众号 QbitAI
256K文本预加载提速超50%,还解锁了1M上下文窗口。
美团龙猫LongCat系列新年出招,宣布全新希罕注重力机制LoZA(LongCat ZigZag Attention)
新手艺集中火力,重点解决长文本使命的明确、算力难题。
相比于LongCat系列之前的全注重力MLA机制,LoZA只改了一半的焦点?。
但模子长文本能力从256K扩展到1M,解码速率还快了不少。
甚至比同类型的Qwen-3模子体现还要好。
接下来看详细计划。
怎样做到 “只算要害部分” ?
全注重力机制的算力瓶颈在于平方级的盘算重漂后O (L?),这导致模子在处置惩罚长文本使命时对显卡要求高,还会泛起推理延迟问题。
LoZA的焦点思绪是专注于处置惩罚主要的内容,不主要的部分少花实力。
作为LongCat系列的焦点手艺升级,LoZA主要是在原来的MLA机制上做刷新。
详细分两步。
首先,给模子里的多头潜在注重力?镸LA做一个全局“筛查”,找出哪些?榭梢员凰⑿。
在原来的MLA架构中,每个MLA?槎际谴χ贸头W⒅亓Φ慕沟愕ノ,现在的新计划是给每个?榕湟桓隹裳叭ㄖ卅。
α值越高,说明该?槎钊⒅亓ε趟阍揭,一旦简化就容易丢性能;α值越低就意味着?榈目商婊恍郧,即便换成更轻量的盘算方法,对整体的明确能力影响也不大。
在训练历程中,团队冻结模子其他参数,只更新α的梯度,通过这种专门的校准训练让模子自主学习α值,然后按α值从小到大排序,找出那些希罕化后不影响性能的MLA?,也就是后续的优化目的。
随后,将找出的50%低性能?榛怀筛嵊牧魇较:弊⒅亓SA
这样就形成了一种交织结构,团队将这种结构称为ZigZag
SSA的盘算重漂后是线性的O (L·S)(S为希罕窗口巨细,牢靠为1024Token),远低于全注重力的O (L?)。
以是这种交织结构让模子既不会由于太过简化而变笨,又能把盘算重漂后降到线性级别,省不少算力。
为了让模子在关注局部细节的基础上不忽略整体逻辑,LoZA还设计了一个1024Token希罕窗口
每个窗口里有1个认真抓整体关联的“全局块”和7个认真盯周围内容的“局部块”,单块巨细为128Token。
这样的刷新也不需要重新训练,在中期训练阶段就能完成,本钱也较量低。
从测试数据来看,LoZA的体现也不错,主要是“更快”的同时“没变笨”
速率上,要是处置惩罚128K上下文,解码速率直接比原来快10倍;
256K上下文,模子预加载(读文本历程)速率快了50%,后续解码阶段天生内容时还能省30%的算力,相当于同样的硬件,现在能同时处置惩罚两倍多的长文本使命。
这也让LongCat-Flash-Exp解锁了1M上下文窗口。
性能上,LoZA也没由于简化而缩水。
处置惩罚回覆问题、写代码这类一样平常使命时,和原版LongCat-Flash持平;处置惩罚长文本使命时,体现反而更好。
好比在MRCR测试里,反超了同样能处置惩罚1M长文本的Qwen-3模子,还更稳固。
接下来,团队还妄想让LoZA支持动态希罕比例
随笔本场景自动多用全注重力包管精度,长文本场景自动增添希罕?樘嵘,甚至适配多模态模子处置惩罚长视频、长图文内容。
好一个新年新气象!
论文地点:https://www.alphaxiv.org/abs/2512.23966
— 完 —
《日韩一级一区》,《Q8X2R7L1T4J5M9B6W3》黄色大片一级
“亚洲综合国产一区二区三区”
专干老熟女色视频
……
01月20日
“91欧洲在线视频”一批自媒体因捏造军事谣言被处置
↓↓↓
01月20日,西藏首届乡村篮球联赛2024“千年盐田”“康BA”拉开战幕,夜夜久久狼人伊人,国产精品午夜掌交A片,欧美一级abbb,熟女少妇精品一区二区
01月20日,(乡村行·看振兴)浙江象山渔村码头推“东海第一口鲜” 共富味十足,久久久久久久久久久久网,国产一级免费性爱视频,品爱阁破解版下载安装最新版本,精品欧美日韩AAAAAA片
01月20日,二手手机买卖 平台压价套路多,芙宁娜大冒险v0.2汉化版怎么下载,黄色精品在线视,在线看av一图,亚洲午夜无码久久yy8090
01月20日|羽联最新世界排名国羽四项名列第一 奥运“五金店”有望再开张?|学生裸体黄 网站|亚洲福利在线视频|国产爱福利|黄色视频三级片A片
01月20日|湖南双峰:外地车大雪中落水 众人跳入刺骨水塘中救人|乱子网站|欧美人与动性欧美精品|AAA级久久久精品无码片视频|老黄色色色色色色
01月20日|2024第二届水岸铁人运动公开赛举行|专约老阿姨精神小伙返场第一集|欧美一级欧美一级在线播|www.76ri.com黄色|久久精品黄片视频……
01月20日,两部门明确两笔交通运输领域资金支出范围,雷电将军打扑克网站,一级欧美AA片免费欢看,猛男GayGay 自慰免费网站,亚洲无码在线伊人
01月20日,日本民众举行抗议 反对排污入海,操操影院,黄色视频插入,淫母日记漫画,打屁屁 光 红 拍击 青少年网站
01月20日|国际机构预测2025年全球电动汽车保有量将增长33% 中国市场居首|欧美三级电影限制黄色福利视频|欧美精品久久一级A片|巨乳女仆被捆绑|牝户伦乱欧美
01月20日,全国总工会发布第七批工会推动治理拖欠职工工资典型案例,欧洲性爱,一级女人18片毛片免费视频v,33dk.c鈥哻,国产AV无码专区
01月20日,各国政要点赞中国—东盟教育交流周!共筑“一带一路”上的新愿景,黑人与孕妇10P,4爱炒菜网站网页版链接怎么打开,成人游戏app推荐免费,国产偷亚洲偷欧美偷精品导航
01月20日,广西龙胜龙脊古壮寨开耕节爬梯田比赛趣味十足,少妇被按摩师强奸AAA片,成人 高潮片免费下载,色噜噜狠狠一区二区三区,黄色三级毛片多人
01月20日|【小新的Vlog】和小新一同感受东川泥石流汽车越野赛“猛兽呼啸”|姬小满本子|又黄又刺激的黄片|天天摸天天透|香蕉网性欧美视频在线观看
01月20日|第六届中法文化论坛在法国多维尔拉开帷幕|丁香五月婷激情四射|欧美日本三级片|狼友推荐网址|国产精品一区在线
01月20日|900余名人工智能应用技术技能人才相聚山东青岛同场竞技|黄色网站精品视频|五月丁香综合激情欧美|可爱清新黑丝伪娘 在床上用电动棒插小骚逼紫薇 仙液狂喷 射的真多|欧美老妇激情XXXX
原省长落马1个月后 原副省长也落马,BW|年轻人热衷“躺营”松弛度假|偷拍自怕亚洲www|国产精品一区二区夜夜嗨Fechikano 1 Espa ol Subtitulado Hentai Online|XXWWW黄久久精品|激情一亚洲Aⅴ一88
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
广东水利多举措迎战北江洪水
深刻把握总体要求和政策取向 巩固和增强经济回升向好态势(深入学习贯彻习近平新时代中国特色社会主义思想)
玩的就是心跳 “五一”假期中外游客赴张家界感受极限刺激
中方是否在伊巴双方之间进行斡旋?外交部回应
春运出行 忘记带身份证怎么乘坐火车?这样解决→
福建漳州芗城:乡村振兴跑 领略诗画浦南
兴凯湖首届冰龙舟比赛开赛 冰面上划龙舟迎龙年
“金庸人生与文学的对话”活动在韩举行
浙江:用5年时间打造农村电商“全国新高地”
央行再推新工具,市场别担心年底缺钱!
无码作爱高潮视频
亚洲免费看欧美女
看黄色免费的视频看黄色免费的视频
男人天堂网在线观看
哈国女人free性HDⅩXX
操欧美美女视频
美女一级牲交免费视频
色色九九
青青青国产综合视频在线观看
欧日一级做a黄色网站

闽公网安备 35010302000113号