首页
闻乐 发自 凹非寺量子位 | 公众号 QbitAI
256K文本预加载提速超50%,还解锁了1M上下文窗口。
美团龙猫LongCat系列新年出招,宣布全新希罕注重力机制LoZA(LongCat ZigZag Attention)
新手艺集中火力,重点解决长文本使命的明确、算力难题。
相比于LongCat系列之前的全注重力MLA机制,LoZA只改了一半的焦点?。
但模子长文本能力从256K扩展到1M,解码速率还快了不少。
甚至比同类型的Qwen-3模子体现还要好。
接下来看详细计划。
怎样做到 “只算要害部分” ?
全注重力机制的算力瓶颈在于平方级的盘算重漂后O (L?),这导致模子在处置惩罚长文本使命时对显卡要求高,还会泛起推理延迟问题。
LoZA的焦点思绪是专注于处置惩罚主要的内容,不主要的部分少花实力。
作为LongCat系列的焦点手艺升级,LoZA主要是在原来的MLA机制上做刷新。
详细分两步。
首先,给模子里的多头潜在注重力?镸LA做一个全局“筛查”,找出哪些?榭梢员凰⑿。
在原来的MLA架构中,每个MLA?槎际谴χ贸头W⒅亓Φ慕沟愕ノ,现在的新计划是给每个?榕湟桓隹裳叭ㄖ卅。
α值越高,说明该?槎钊⒅亓ε趟阍揭,一旦简化就容易丢性能;α值越低就意味着?榈目商婊恍郧,即便换成更轻量的盘算方法,对整体的明确能力影响也不大。
在训练历程中,团队冻结模子其他参数,只更新α的梯度,通过这种专门的校准训练让模子自主学习α值,然后按α值从小到大排序,找出那些希罕化后不影响性能的MLA?,也就是后续的优化目的。
随后,将找出的50%低性能?榛怀筛嵊牧魇较:弊⒅亓SA
这样就形成了一种交织结构,团队将这种结构称为ZigZag
SSA的盘算重漂后是线性的O (L·S)(S为希罕窗口巨细,牢靠为1024Token),远低于全注重力的O (L?)。
以是这种交织结构让模子既不会由于太过简化而变笨,又能把盘算重漂后降到线性级别,省不少算力。
为了让模子在关注局部细节的基础上不忽略整体逻辑,LoZA还设计了一个1024Token希罕窗口
每个窗口里有1个认真抓整体关联的“全局块”和7个认真盯周围内容的“局部块”,单块巨细为128Token。
这样的刷新也不需要重新训练,在中期训练阶段就能完成,本钱也较量低。
从测试数据来看,LoZA的体现也不错,主要是“更快”的同时“没变笨”
速率上,要是处置惩罚128K上下文,解码速率直接比原来快10倍;
256K上下文,模子预加载(读文本历程)速率快了50%,后续解码阶段天生内容时还能省30%的算力,相当于同样的硬件,现在能同时处置惩罚两倍多的长文本使命。
这也让LongCat-Flash-Exp解锁了1M上下文窗口。
性能上,LoZA也没由于简化而缩水。
处置惩罚回覆问题、写代码这类一样平常使命时,和原版LongCat-Flash持平;处置惩罚长文本使命时,体现反而更好。
好比在MRCR测试里,反超了同样能处置惩罚1M长文本的Qwen-3模子,还更稳固。
接下来,团队还妄想让LoZA支持动态希罕比例
随笔本场景自动多用全注重力包管精度,长文本场景自动增添希罕?樘嵘,甚至适配多模态模子处置惩罚长视频、长图文内容。
好一个新年新气象!
论文地点:https://www.alphaxiv.org/abs/2512.23966
— 完 —
《97超级人人免费碰碰频道》,《Q8X2R7L1T4J5M9B6W3》少妇人
“公牛与女人一级毛”
芙宁娜扒开胸罩 给男生看
……
01月21日
“黄色三级片不卡在线观看”末代厨娘
↓↓↓
01月21日,云南野生动物园大熊猫“珍多”迎来十岁生日,全彩H漫无遮挡全彩3D,黄色直接进网站大全,酒药做爱视频大全,办公室刺激战场一共几集
01月21日,聚焦穿越周期 2024光伏行业年度大会在四川宜宾开幕,a级毛片久久天堂,aaa超黄视频,乖~把小屁股眼露出来视频,99精品视频6
01月21日,美方称瑙鲁断绝同台湾“外交关系”令人失望 中方驳斥,www.一级免费网站,缅甸3分19秒砍断手断脚,欧美艹穴在线看,精品色网
01月21日|新疆铁路客发量首次突破4500万人次|日韩欧美亚在线视频|手机黄色视频不卡毛片|亚洲综合二区在线视频|在线视频 二区
01月21日|以北部拉响防空警报 以军:拦截来自黎巴嫩方向空中目标|中日韩黄色网站|亚洲一级毛片无码专区3劈|黄色网站黄色网站黄色网|超碰100
01月21日|日本一架飞机坠落悬崖 系着陆后冲出跑道|美女露出 让男生吃奶|色狠狠色综合天天综和色|国产乱了bbw|性交高潮喷水视频……
01月21日,东西问·中国石窟|丝绸之路与唐蕃古道如何在炳灵寺石窟牵手?,国产精品国产三级天天更新,曙光医生告诉您怎么避免手淫早泄,老熟妇BBXXX视频,找免费黄色网站
01月21日,面对AI,巴菲特为何“投资理念不会有任何改变”,新国模网,欧美熟妇黑人ⅩXXXXX,日日操草,国产精品一区第一人称
01月21日|台湾花莲县海域发生5.3级地震 震源深度10千米|国产精品 出|www.无码国产|猎奇av|无码国产模特AV免费私拍
01月21日,自然课堂探索生物奥秘迈向物流强国的路上,如何做到“一个也不能少”?,黄色仓库APP,轻点灬公大JI巴又大又漫画一,人人操人人爽97,久久婷婷五月综合色欧美
01月21日,【理响中国·实践新论】海报|掌握发展进步的命运关键在“自主”,亚洲无码免费视频,肛日韩视频一区,中文字幕精品亚洲一区1080P,交性一级视频
01月21日,突发!韩方称朝鲜向半岛东部海域发射弹道导弹,国产夫妻性做爱黄色录像一区二区三区,色色色色色色色色网站,程潇mv造梦大全视频下载,9117c六间房
01月21日|美媒:哈里斯选择明尼苏达州州长沃尔兹为竞选搭档|黄片一级无码在线嘿嘿|黄色性爱高潮网站在线免费观看视频|欧美三级片视频在线播放|正在播放一区二区三区四区
01月21日|天津:百年金融街上演时装秀|小明小明我要看A片现场直播|色色色色色色色色色色色色色色色色色色|www.操逼克.com|性欧美videos另类精品
01月21日|北美票房:瑞恩·高斯林新片《特技狂人》登榜首|A级毛片无码兔费久久|黄色一级片高清视频一区二区三区|欧美黄片有毛在线观看|欧美色A电影精品AAAA
鼎益丰确认出现兑付困难,25时,赤坂见|社交平台刮起“碘伏美白风” 专家:别信|精品精品国产自在久久高清|国产精品久久久性色|国产午夜福利在线一区|国产 在线第一页
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
前三季度规上轻工企业实现利润超万亿元
广西举办创意导游大赛 演述精彩壮乡故事
湖北襄阳:“头鱼”竞拍助推生态保护
琼州海峡过海车票紧俏 海口新海港增开新能源小车出岛专班
网店商家虚假发货到底为了啥?
持续高温炙烤我国北方,专家:今夏高温来得早,也会较频繁
万名跑友齐聚 首届北京海淀马拉松激情开跑
“青藏优品”绿色有机农畜产品汇选馆在杭州开馆
解锁复兴号智能动车组更多体验
外籍博主:新疆是中国通达世界的“窗口”
人人爽,人人操
妓女网久久av
又粗又猛又黄的免费视频
免费看中国特级黄片儿
老师哭着说不能再继续
3D黄漫 18禁视频免费看网站
小 戳进 好舒服
综合激情网3p
成人最新一期二期三期平果
黄色视频国产无码在线观看

闽公网安备 35010302000113号