首页
闻乐 发自 凹非寺量子位 | 公众号 QbitAI
256K文本预加载提速超50%,还解锁了1M上下文窗口。
美团龙猫LongCat系列新年出招,宣布全新希罕注重力机制LoZA(LongCat ZigZag Attention)
新手艺集中火力,重点解决长文本使命的明确、算力难题。
相比于LongCat系列之前的全注重力MLA机制,LoZA只改了一半的焦点?。
但模子长文本能力从256K扩展到1M,解码速率还快了不少。
甚至比同类型的Qwen-3模子体现还要好。
接下来看详细计划。
怎样做到 “只算要害部分” ?
全注重力机制的算力瓶颈在于平方级的盘算重漂后O (L?),这导致模子在处置惩罚长文本使命时对显卡要求高,还会泛起推理延迟问题。
LoZA的焦点思绪是专注于处置惩罚主要的内容,不主要的部分少花实力。
作为LongCat系列的焦点手艺升级,LoZA主要是在原来的MLA机制上做刷新。
详细分两步。
首先,给模子里的多头潜在注重力?镸LA做一个全局“筛查”,找出哪些?榭梢员凰⑿。
在原来的MLA架构中,每个MLA?槎际谴χ贸头W⒅亓Φ慕沟愕ノ,现在的新计划是给每个?榕湟桓隹裳叭ㄖ卅。
α值越高,说明该?槎钊⒅亓ε趟阍揭,一旦简化就容易丢性能;α值越低就意味着?榈目商婊恍郧,即便换成更轻量的盘算方法,对整体的明确能力影响也不大。
在训练历程中,团队冻结模子其他参数,只更新α的梯度,通过这种专门的校准训练让模子自主学习α值,然后按α值从小到大排序,找出那些希罕化后不影响性能的MLA?,也就是后续的优化目的。
随后,将找出的50%低性能?榛怀筛嵊牧魇较:弊⒅亓SA
这样就形成了一种交织结构,团队将这种结构称为ZigZag
SSA的盘算重漂后是线性的O (L·S)(S为希罕窗口巨细,牢靠为1024Token),远低于全注重力的O (L?)。
以是这种交织结构让模子既不会由于太过简化而变笨,又能把盘算重漂后降到线性级别,省不少算力。
为了让模子在关注局部细节的基础上不忽略整体逻辑,LoZA还设计了一个1024Token希罕窗口
每个窗口里有1个认真抓整体关联的“全局块”和7个认真盯周围内容的“局部块”,单块巨细为128Token。
这样的刷新也不需要重新训练,在中期训练阶段就能完成,本钱也较量低。
从测试数据来看,LoZA的体现也不错,主要是“更快”的同时“没变笨”
速率上,要是处置惩罚128K上下文,解码速率直接比原来快10倍;
256K上下文,模子预加载(读文本历程)速率快了50%,后续解码阶段天生内容时还能省30%的算力,相当于同样的硬件,现在能同时处置惩罚两倍多的长文本使命。
这也让LongCat-Flash-Exp解锁了1M上下文窗口。
性能上,LoZA也没由于简化而缩水。
处置惩罚回覆问题、写代码这类一样平常使命时,和原版LongCat-Flash持平;处置惩罚长文本使命时,体现反而更好。
好比在MRCR测试里,反超了同样能处置惩罚1M长文本的Qwen-3模子,还更稳固。
接下来,团队还妄想让LoZA支持动态希罕比例
随笔本场景自动多用全注重力包管精度,长文本场景自动增添希罕?樘嵘,甚至适配多模态模子处置惩罚长视频、长图文内容。
好一个新年新气象!
论文地点:https://www.alphaxiv.org/abs/2512.23966
— 完 —
《久久久久久黄人妻无码》,《Q8X2R7L1T4J5M9B6W3》91萝莉双乳被挤射
“人成网免费视频”
欧美性爱顶爆
……
01月13日
“A片免费地”伊朗:看我这防空系统可还行?
↓↓↓
01月13日,观沧海|“机遇湾区,机遇港澳”: 湾区优质生活圈加速形成,困困狗推特全集,女人十八毛a级毛片,美女黄频,欧美性A片人喾交A片
01月13日,天津培育壮大创新链 赋能产业升级,身为人母高清完整版在线观看,久久最新性爱视频,自拍偷拍片,男同打屁股网站
01月13日,贝莉·塔蒂蓝湾大师赛创最好成绩夺冠 中国选手刘瑞欣排名第七,金发美女28P,亚洲色图 自拍,亚洲欧美日韩国产另类高清,欧美apian
01月13日|找个好保姆只能靠运气?数字化赋能甘肃家政“优中选优”|jizz黄色视频免费在线观看|日本成年人免费黄色视频|一级 a 一级 a爱片免费免免黄|图片区小说区偷拍区视频777
01月13日|中方呼吁国际社会继续支持联合国近东救济工程处工作|日韩 国产 欧美视频一区二区三区|ysh200 fiwmu cn|操她网站|欧美日本一区二区三区片
01月13日|覆盖1.8亿人 长护险如何破解“一人失能、全家失衡”难题|久久精品视频在线|黄视频亚洲|性妓奴虐重口A片视频免费|在线免费看Av看……
01月13日,全球近百名顶尖电竞选手参与 2024上海电竞大师赛开赛,江冮片库,宝贝儿浪一点把屁股撅起来让我操视频网站九九九,www.大色网 .com,小鸡入水蜜桃免费观看电视剧
01月13日,海口兴潮天后宫重修开放:妈祖文化联结海内外乡情,免费的黄色一级片网站,更多免费好看黄色网站,欧洲日韩国产VA高清视频,欧美少妇高潮视频
01月13日|江西庐山如琴湖日落美景再现李白梦幻诗境|国产丝袜女人对白AV在在线|鲁鲁宅男视频|小 戳进老师 里面无挡|99在线综合
01月13日,全国首单暂时进境修理内销业务在海口落地,黄色彩网,男女操网站,白丝jk 爆 乳 的视频,雷电将军18
01月13日,广东逾2000个气象站录得暴雨 全省加强防御强降雨,高清无码看毛片,a一级大片,日a女在线播放免费视频,欧洲欧美一区
01月13日,北交所:公司和企业债券市场今天正式开市,黄网网站在线观看官网,三级片视频网站,欧美日韩精品一区,人人睡人人操人人干人人摸人人上
01月13日|代表通道丨扎西江村:民族团结像阳光和空气一样融入每一个人血脉当中|欧美黑人狂野激情A片视频|欧美a在线观看视频|免费观看黄视频网站|男男少年乖h调教跪趴
01月13日|多家影视上市公司业绩持续向好|亚洲美女模特一级A片|黄色视频三级片A片|欧美精品三区|国产黄色视频免费在线观看www.
01月13日|7月份中国物流业景气指数为51% 业务需求量保持增长|在线播放 无码国产|久久6|免费3级毛片视频|擼擼社2025免费看黄
宋运辉梁思申一吻定情,职业替身|中国体育代表团:应对个别出现失误运动员给予理解|sao69|三级黄片aa|多人群p孕妇亚洲网站|薛凯琪吃黑肠视频的起源和历史
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
日本大选投票开始 执政联盟席位能否过半成焦点
从田间到“指尖” 乡村快递的提速有了新秘诀
众星云集第十七届亚洲电影大奖颁奖典礼 张艺谋获“终身成就奖”
王永庆谈歼-35A设计:细节体现了设计师的高度智慧
(澳门回归25周年)澳门工联总会:为澳门职工群众安居乐业竭诚服务
云南省人民检察院原副检察长韩跃先接受审查调查
百年金庸的故乡情结
探访山西两周精品文物展:展现晋国600多年历史
“绅装骑行”引争议 小资还是审丑?
“百花齐放”的静电板班
www.亚洲4444
免费看美女裸体🔞🔞🔞中国
jk白丝自慰
精品91 海角乱
91最新光胸女生视频
欧美AAA 视频二区
欧美污污视频
巨胸藏麦
淫荡教师视频
人人操人人搞人人爽日日搞

闽公网安备 35010302000113号