首页
闻乐 发自 凹非寺量子位 | 公众号 QbitAI
256K文本预加载提速超50%,还解锁了1M上下文窗口。
美团龙猫LongCat系列新年出招,宣布全新希罕注重力机制LoZA(LongCat ZigZag Attention)
新手艺集中火力,重点解决长文本使命的明确、算力难题。
相比于LongCat系列之前的全注重力MLA机制,LoZA只改了一半的焦点?。
但模子长文本能力从256K扩展到1M,解码速率还快了不少。
甚至比同类型的Qwen-3模子体现还要好。
接下来看详细计划。
怎样做到 “只算要害部分” ?
全注重力机制的算力瓶颈在于平方级的盘算重漂后O (L?),这导致模子在处置惩罚长文本使命时对显卡要求高,还会泛起推理延迟问题。
LoZA的焦点思绪是专注于处置惩罚主要的内容,不主要的部分少花实力。
作为LongCat系列的焦点手艺升级,LoZA主要是在原来的MLA机制上做刷新。
详细分两步。
首先,给模子里的多头潜在注重力?镸LA做一个全局“筛查”,找出哪些?榭梢员凰⑿。
在原来的MLA架构中,每个MLA?槎际谴χ贸头W⒅亓Φ慕沟愕ノ,现在的新计划是给每个?榕湟桓隹裳叭ㄖ卅。
α值越高,说明该?槎钊⒅亓ε趟阍揭,一旦简化就容易丢性能;α值越低就意味着?榈目商婊恍郧,即便换成更轻量的盘算方法,对整体的明确能力影响也不大。
在训练历程中,团队冻结模子其他参数,只更新α的梯度,通过这种专门的校准训练让模子自主学习α值,然后按α值从小到大排序,找出那些希罕化后不影响性能的MLA?,也就是后续的优化目的。
随后,将找出的50%低性能?榛怀筛嵊牧魇较:弊⒅亓SA
这样就形成了一种交织结构,团队将这种结构称为ZigZag
SSA的盘算重漂后是线性的O (L·S)(S为希罕窗口巨细,牢靠为1024Token),远低于全注重力的O (L?)。
以是这种交织结构让模子既不会由于太过简化而变笨,又能把盘算重漂后降到线性级别,省不少算力。
为了让模子在关注局部细节的基础上不忽略整体逻辑,LoZA还设计了一个1024Token希罕窗口
每个窗口里有1个认真抓整体关联的“全局块”和7个认真盯周围内容的“局部块”,单块巨细为128Token。
这样的刷新也不需要重新训练,在中期训练阶段就能完成,本钱也较量低。
从测试数据来看,LoZA的体现也不错,主要是“更快”的同时“没变笨”
速率上,要是处置惩罚128K上下文,解码速率直接比原来快10倍;
256K上下文,模子预加载(读文本历程)速率快了50%,后续解码阶段天生内容时还能省30%的算力,相当于同样的硬件,现在能同时处置惩罚两倍多的长文本使命。
这也让LongCat-Flash-Exp解锁了1M上下文窗口。
性能上,LoZA也没由于简化而缩水。
处置惩罚回覆问题、写代码这类一样平常使命时,和原版LongCat-Flash持平;处置惩罚长文本使命时,体现反而更好。
好比在MRCR测试里,反超了同样能处置惩罚1M长文本的Qwen-3模子,还更稳固。
接下来,团队还妄想让LoZA支持动态希罕比例
随笔本场景自动多用全注重力包管精度,长文本场景自动增添希罕?樘嵘,甚至适配多模态模子处置惩罚长视频、长图文内容。
好一个新年新气象!
论文地点:https://www.alphaxiv.org/abs/2512.23966
— 完 —
《黄色网址大片久久久大全》,《Q8X2R7L1T4J5M9B6W3》日本全日本黄三级网站大全
“天天日天天草”
甘雨 到爽 高潮痉挛动漫
……
01月15日
“18以下禁看视频网站国产”拜登将正式道歉
↓↓↓
01月15日,乡村产业发展“缺地”?浙江探索“点土生金”,薛凯琪吃毒肠是第几集,久色有码,人人插人人操人人插,人人操人插
01月15日,“数字消费”维权堵点频发 如何更好保障消费者权益,亚洲AV无码秘蜜桃蘑菇,www.色就是色,妇乱子伦现频,谷露视频旧视频
01月15日,法院支持爱心人士监护,“野娃儿”开心了,中文字幕 第5页,18禁涩动漫,黑人大战欧美丰满艳星,一级a视频免费看裸体美女
01月15日|从“重糖轻药”到“老方新品” 浙江八珍糕的百年传承路|在线免费观看不卡a片|国产男女羞羞视频网站免费|亚洲AV毛片儿激烈的|日韩大片免a费观看视频
01月15日|马来西亚发布《吉隆坡20行动文件》 打造创业生态系统|欧美gif一区二区三区|黄色无码a|欧美亚洲欧美|在线一本
01月15日|中国新一代隐身战斗机歼-35A“新”在哪里?首席专家解读|欧美熟妇乱子精品|男女无遮挡全过程免费视频|可以直接看黄色的免费网站|视频色色……
01月15日,陕西省政协原主席韩勇涉嫌受贿被公诉,国产在线系列不卡天堂网,猎户H圆房~H嗯啊1V2,福利影院大全,黄色视频免费看wwwwwwaa
01月15日,“消费返现”骗局再现!有人上当被骗数万元,一级一片,免费看黄片男人玩女人逼黄片,精品人妻激情一区二区中文字幕,黄色视屏网站免费观看
01月15日|文化中国行·长江之歌丨千年窑火瓷韵新|小马拉大车吃童子鸡演员表|欧美福利1区|久久黄片18|影音先锋人妻啪啪aV资源网站
01月15日,礼来替尔泊肽实现平均减重20.2% 头对头研究显示优于司美格鲁肽的13.7%,国内自拍视频在线观看网站上,亚洲一级片,变性人妖的隐私秘 脱裤子,国产一级啪啪视频免费观看
01月15日,台湾乐手来牵手 两岸“芗”音共潮生,国语对白 自拍,www.91黄色网站,苍井空 码,97大学生情侣酒店自拍亚洲精品
01月15日,紧扣推进中国式现代化(人民观点)——牢牢把握进一步全面深化改革的主题①,一级免费爱爱视频,亚洲视频无线观看,绿林仙踪官网首页,Japanese拳交女王
01月15日|斯诺克世锦赛:张安达止步首轮 吕昊天半程落后|欧美性 XX XX XXX动态|美女操逼操逼操逼|超高清无码免费黄色网址|在线免费观看的黄色网站
01月15日|一季度云南风力、太阳能等发电量增幅明显 有效弥补水电下降影响|a片毛|Angelina高潮在线观看|国产V日韩V欧美V精品专区|黄色91av在线
01月15日|天津南港工业区120万吨/年乙烯项目投产 助力石化升级与区域协同发展|www.anglecn.com|万紫千红打板子vk|黄片在线啊啊啊|视频黄页在线
退休干部举报县领导被公诉:检方撤诉,吉祥物Luce已现身天主教堂|云南西双版纳:星光夜市高人气点亮“夜经济”|国产在线小视频|帅哥solo放烟花|理论黄色网站在线观看|亚洲午夜福利一级无码
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
张文杰任温州市市长
南方多地开启暴雪模式,湖南贵州启动应急响应
影游跨界融合催生国漫新动力
外国驻蓉领事机构官员看四川“两会”:见证四川发展 把握合作机遇
重庆两江新区管理委员会一级巡视员李光荣接受审查调查
设备更新和消费品换新将如何撬动内需大市场?——两会中国经济问答之九
7月中国仓储指数为46.5% 消费品业务活动表现相对较好
中东部雨雪过程今起收尾 气温偏低状态仍将维持
“悦享童年·公益阅读”世界读书日系列活动在北京举办
绿色“一带一路”十周年创新理念与实践案例(一)
杨晨晨生物老师亲身授课视频 土豪定制
操黑人大逼
亚洲欧美日本一区二区三区夜夜嗨
超碰在线夜色WWW
午夜福利精品免费视频
按摩师边吻奶边挵进去按摩
男男gaYGAYS 男同控精
13小箩莉videosHD
毛片A片网址
百媚导入a

闽公网安备 35010302000113号