首页
闻乐 发自 凹非寺量子位 | 公众号 QbitAI
256K文本预加载提速超50%,还解锁了1M上下文窗口。
美团龙猫LongCat系列新年出招,宣布全新希罕注重力机制LoZA(LongCat ZigZag Attention)
新手艺集中火力,重点解决长文本使命的明确、算力难题。
相比于LongCat系列之前的全注重力MLA机制,LoZA只改了一半的焦点?。
但模子长文本能力从256K扩展到1M,解码速率还快了不少。
甚至比同类型的Qwen-3模子体现还要好。
接下来看详细计划。
怎样做到 “只算要害部分” ?
全注重力机制的算力瓶颈在于平方级的盘算重漂后O (L?),这导致模子在处置惩罚长文本使命时对显卡要求高,还会泛起推理延迟问题。
LoZA的焦点思绪是专注于处置惩罚主要的内容,不主要的部分少花实力。
作为LongCat系列的焦点手艺升级,LoZA主要是在原来的MLA机制上做刷新。
详细分两步。
首先,给模子里的多头潜在注重力?镸LA做一个全局“筛查”,找出哪些?榭梢员凰⑿。
在原来的MLA架构中,每个MLA?槎际谴χ贸头W⒅亓Φ慕沟愕ノ,现在的新计划是给每个?榕湟桓隹裳叭ㄖ卅。
α值越高,说明该?槎钊⒅亓ε趟阍揭,一旦简化就容易丢性能;α值越低就意味着?榈目商婊恍郧,即便换成更轻量的盘算方法,对整体的明确能力影响也不大。
在训练历程中,团队冻结模子其他参数,只更新α的梯度,通过这种专门的校准训练让模子自主学习α值,然后按α值从小到大排序,找出那些希罕化后不影响性能的MLA?,也就是后续的优化目的。
随后,将找出的50%低性能?榛怀筛嵊牧魇较:弊⒅亓SA
这样就形成了一种交织结构,团队将这种结构称为ZigZag
SSA的盘算重漂后是线性的O (L·S)(S为希罕窗口巨细,牢靠为1024Token),远低于全注重力的O (L?)。
以是这种交织结构让模子既不会由于太过简化而变笨,又能把盘算重漂后降到线性级别,省不少算力。
为了让模子在关注局部细节的基础上不忽略整体逻辑,LoZA还设计了一个1024Token希罕窗口
每个窗口里有1个认真抓整体关联的“全局块”和7个认真盯周围内容的“局部块”,单块巨细为128Token。
这样的刷新也不需要重新训练,在中期训练阶段就能完成,本钱也较量低。
从测试数据来看,LoZA的体现也不错,主要是“更快”的同时“没变笨”
速率上,要是处置惩罚128K上下文,解码速率直接比原来快10倍;
256K上下文,模子预加载(读文本历程)速率快了50%,后续解码阶段天生内容时还能省30%的算力,相当于同样的硬件,现在能同时处置惩罚两倍多的长文本使命。
这也让LongCat-Flash-Exp解锁了1M上下文窗口。
性能上,LoZA也没由于简化而缩水。
处置惩罚回覆问题、写代码这类一样平常使命时,和原版LongCat-Flash持平;处置惩罚长文本使命时,体现反而更好。
好比在MRCR测试里,反超了同样能处置惩罚1M长文本的Qwen-3模子,还更稳固。
接下来,团队还妄想让LoZA支持动态希罕比例
随笔本场景自动多用全注重力包管精度,长文本场景自动增添希罕?樘嵘,甚至适配多模态模子处置惩罚长视频、长图文内容。
好一个新年新气象!
论文地点:https://www.alphaxiv.org/abs/2512.23966
— 完 —
《又大又粗又爽A级毛片免费看》,《Q8X2R7L1T4J5M9B6W3》亚洲三级不卡
“舞蹈生被男老师c到崩溃”
欧美性爱自拍视频
……
01月16日
“黄页变态视频免费在线观看”栾留伟火锅店平台收藏数已破万
↓↓↓
01月16日,直播间成夏日旅行“任意门” 在线“云”游成常态,毛片a片一级片,国产中文老熟女视频三级片,日韩欧美国产精品一区,美女被c到爽哭视频在线观看
01月16日,吉林体育去年以来不断取得“历史性突破”,女校 脱 给我揉 蜜桃视频,日本高清不卡a免费网站,同画合集,在线看AAAA级毛片视频
01月16日,短视频上的“心理学家”:人人都是人格诊断专家?,人人人做人人爽欧美人4色,黄色网站免费性爱视频,澳门精品一区视频,草神裸体
01月16日|著名华人物理学家、诺贝尔物理学奖获得者李政道去世 享年98岁|西施被c|免费观看学生黃色A片|小草神脸红翻白眼|99re这里只有
01月16日|香港消委会公布最新一期《选择》月刊 测试唇膏等多款产品|永久免费 ,视频|美女天天操|巨大 奶头XXXXX|播亚洲一区二区三区号av
01月16日|多部门联动形成应急合力 全力保障恶劣天气道路安全|国产原创10p|免费无码在线视频aaaAV|鞠婧祎有肛门吗|哪咤禁漫……
01月16日,就业形势总体保持稳定——中国经济首季报亮点之四,精品色网,老师在浴室打开内裤让我c,美女洗澡裸露双奶,一级a视频免费看裸体美女
01月16日,不折不扣落实好结构性减税降费政策,黑料社,狼友免费观看,小俊┅┅快┅┅用力啊第7集,人妻啪啪蜜臀av
01月16日|黄河水利委员会启动干旱防御Ⅳ级应急响应 |一本久久a久久精品综合香蕉|717午夜理论|火神玛薇卡被丘丘人抓去繁衍后代|在线观看藏精阁
01月16日,政策“组合拳”+数字化建设 中国高水平对外开放铺展恢宏画卷,18岁禁区,五十路熟女乱伦,绿帽网址,亚洲日韩五月天三级图片
01月16日,中尼艺术家携手迎春 “春之声·金梦想”云南跨国春晚加德满都上演,538在线精品免费播放视频,猛插淫逼h边上课边c,AV 无码 高潮 在线下载白丝,恋足癖社交app
01月16日,众行致远|全球治理凝聚“南方”力量 ,十分污的国产黄色网站,亚洲激情视频中文字幕版,狼色精品视频手机在线播放,九九理伦
01月16日|“五一”假期我国刑事、治安警情同比分别下降3.6%、14.7%|哦黃片視頻來看|中国老太太躁逼流白水|黄页在线免费观看视频|馃憴馃憼馃崋
01月16日|春运期间东航加大在湖北市场运力投放|黑丝在线一区|国产精品国语对白露脸|国产三级兔费看|国产伦精品一区二区三区视频九色
01月16日|中国海警依法驱离日非法进入我钓鱼岛领海船只|免费A级毛片无码久久版首页-亚洲一级av无码毛片久久精品,免费A级毛片av无码|黑人巨吊狂草|姬小满裸体 开腿被c|美女c
如何评价周星驰入局短剧,王楚钦继续霸榜世一位置|读懂低空经济发展的前景和挑战 专家建议:从四个维度创新推进低空经济发展|姬小满奖励自己的视频|欧美日韩操逼|欧美国产一区精品免费观看|奏钢部长被解职的原因是什么
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
200名中俄“泳士”横渡两国界江
美国国务卿布林肯将访华
创新药上海落地 助“短肠人”摆脱长时段输液苦楚
最高法解读工作报告:要实现对诉讼的源头治理
【澜湄印象】航拍达那寺和格萨尔三十大将军灵塔
2025春节机票搜索量暴涨2.2倍 除夕当天多条航线经济舱全价
2024“一带一路”瓜菜产业发展大会在新疆喀什开幕
后厨直播不应沦为摆设
道中华丨拉祜族好男人花
G5京昆高速成雅段发生一起交通事故 造成1人死亡多人受伤
国产一区二区三区色噜噜
欧美黄色视频欧美黄色视频国产黄色视频黄色视频日韩视频日韩黄色视频
日本免费一级AAA片
超碰播放
日本在线视频青草
A国产在线黄精品
中国熟妇东北自拍XXXX
欧美成年人性爱网站
砂狼白子被 高潮视频
性色AV片妓女毛片

闽公网安备 35010302000113号