首页
闻乐 发自 凹非寺量子位 | 公众号 QbitAI
256K文本预加载提速超50%,还解锁了1M上下文窗口。
美团龙猫LongCat系列新年出招,宣布全新希罕注重力机制LoZA(LongCat ZigZag Attention)
新手艺集中火力,重点解决长文本使命的明确、算力难题。
相比于LongCat系列之前的全注重力MLA机制,LoZA只改了一半的焦点?。
但模子长文本能力从256K扩展到1M,解码速率还快了不少。
甚至比同类型的Qwen-3模子体现还要好。
接下来看详细计划。
怎样做到 “只算要害部分” ?
全注重力机制的算力瓶颈在于平方级的盘算重漂后O (L?),这导致模子在处置惩罚长文本使命时对显卡要求高,还会泛起推理延迟问题。
LoZA的焦点思绪是专注于处置惩罚主要的内容,不主要的部分少花实力。
作为LongCat系列的焦点手艺升级,LoZA主要是在原来的MLA机制上做刷新。
详细分两步。
首先,给模子里的多头潜在注重力?镸LA做一个全局“筛查”,找出哪些?榭梢员凰⑿。
在原来的MLA架构中,每个MLA?槎际谴χ贸头W⒅亓Φ慕沟愕ノ,现在的新计划是给每个?榕湟桓隹裳叭ㄖ卅。
α值越高,说明该?槎钊⒅亓ε趟阍揭,一旦简化就容易丢性能;α值越低就意味着?榈目商婊恍郧,即便换成更轻量的盘算方法,对整体的明确能力影响也不大。
在训练历程中,团队冻结模子其他参数,只更新α的梯度,通过这种专门的校准训练让模子自主学习α值,然后按α值从小到大排序,找出那些希罕化后不影响性能的MLA?,也就是后续的优化目的。
随后,将找出的50%低性能?榛怀筛嵊牧魇较:弊⒅亓SA
这样就形成了一种交织结构,团队将这种结构称为ZigZag
SSA的盘算重漂后是线性的O (L·S)(S为希罕窗口巨细,牢靠为1024Token),远低于全注重力的O (L?)。
以是这种交织结构让模子既不会由于太过简化而变笨,又能把盘算重漂后降到线性级别,省不少算力。
为了让模子在关注局部细节的基础上不忽略整体逻辑,LoZA还设计了一个1024Token希罕窗口
每个窗口里有1个认真抓整体关联的“全局块”和7个认真盯周围内容的“局部块”,单块巨细为128Token。
这样的刷新也不需要重新训练,在中期训练阶段就能完成,本钱也较量低。
从测试数据来看,LoZA的体现也不错,主要是“更快”的同时“没变笨”
速率上,要是处置惩罚128K上下文,解码速率直接比原来快10倍;
256K上下文,模子预加载(读文本历程)速率快了50%,后续解码阶段天生内容时还能省30%的算力,相当于同样的硬件,现在能同时处置惩罚两倍多的长文本使命。
这也让LongCat-Flash-Exp解锁了1M上下文窗口。
性能上,LoZA也没由于简化而缩水。
处置惩罚回覆问题、写代码这类一样平常使命时,和原版LongCat-Flash持平;处置惩罚长文本使命时,体现反而更好。
好比在MRCR测试里,反超了同样能处置惩罚1M长文本的Qwen-3模子,还更稳固。
接下来,团队还妄想让LoZA支持动态希罕比例
随笔本场景自动多用全注重力包管精度,长文本场景自动增添希罕?樘嵘,甚至适配多模态模子处置惩罚长视频、长图文内容。
好一个新年新气象!
论文地点:https://www.alphaxiv.org/abs/2512.23966
— 完 —
《最产麻豆视频》,《Q8X2R7L1T4J5M9B6W3》91华人一区视频在线观看
“人人爱人人操人人槽”
欧美一级性交A
……
01月18日
“免费看小男生裸体自慰”时代少年团收到李宇春送的小牛
↓↓↓
01月18日,首个“银发经济”文件,如何加强养老服务?,精品国产三级A∨在线App,欧美一级在线播放器,在野外被干高潮了h边做边叫,一级片美女
01月18日,15天1328公里!新生骑行去北大,屁屁影院第一网址,97夜夜澡人人双人人人喊,看片网址A片,国产超级av
01月18日,去年A股年度现金分红合计2.24万亿元,青草久久AV,欧美一级婬片A片免费手机版动,欧美一级高清手机在线观看,被 下部 羞羞麻豆
01月18日|“虎爸”回应10岁女儿跑“全马”争议:不会影响我和孩子跑步的节奏|青春草在线视频精品资源网|欧美一级在线电影|潘涩里|Feer XXX ssss
01月18日|新疆首个中医药文化及野生植物司法保护基地成立|欧美性爱6|秘 黄漫免费网站|亚洲天堂社区|可以直接观看的av网址
01月18日|“全国模范检察官”潘非琼:公诉席上的忠诚卫士|xnxx美女|逼逼爱插插午夜景院|一个人在线视频免费观看片毛片|国产精品一级特黄大片……
01月18日,北京推出“京彩过年指南” 促消费活动超千项,网站在线观看你懂的啦,两个小伙专约熟女拍视频,深夜福利啪啪啪,Garyboy
01月18日,财政部:2024年安排中央对地方转移支付超10万亿元 预算已下达超八成,国产精品永久久久久久久久久,国产A级毛片无码精品视频,欧美一级另类孕妇视频,张婉莹手笔紫薇免费全集
01月18日|中国作协第二届全民阅读季在重庆启动|黄色视频网址免费|久久久久囯产精品无码|www.小穴潮喷啪啪视频|亚洲顶级美女性爱视频
01月18日,汉江流域高香茶原产地交易市场开市 助力“茶叶”变 “茶业”,视色网站视色网,国产乱色在线观看视频,高清🈚️码🔞❌♋️在线看片官方版,人人插人人摸人人鲁A片
01月18日,水利部针对晋陕宁3省区启动洪水防御Ⅳ级应急响应,av黄片毛片日韩,国产调教视频一区二区三区,91在线禁插,日本成片区免费久久中文
01月18日,贺兰山网评:春运大潮映照出新时代活力影像,亚洲色情综合小说图区,久久这里只有欧美精品,看大黄片,免费的黄色网站在线看
01月18日|青海海东首批地震灾后重建项目已开工建设|免费在线黄色视频一级黄色录像影片免费在线视频|欧美激情精品久久久久久|A片免费看观点击进入好|日本三级小姨子妓女高清
01月18日|法国总统马克龙概述执政党议会选举纲领 痛批极右翼政党|操欧美女人|丁香五月婷激情四射|加勒比黄色|又黄又爽又粗又大的视频
01月18日|共同书写中国式现代化建设新篇章——热烈祝贺全国两会胜利闭幕|欧美成视频在线观看|黄色网站黄色视频播放一二三区视频播放|藤环奈教师中文字幕影视|既免费又爽的黄色网,。。
如何评价黑神话猪八戒剧情争议,马林受伤退赛|【澜湄印象】“Z世代”泰国女孩长春学中医:针灸拔罐样样精通|artists高清免费下载|亚洲精品无码mv在线观看网站亚洲最新永久在线观看,亚洲国产精品网站在线播放,|人人操夜夜操夜夜操|zooskoolvideo18
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
“五一”假期 南京夫子庙景区游人如织
中国足协公示2025赛季职业联赛准入第一批完成债务清偿俱乐部名单
国台办:乐见更多台湾影迷、剧迷能够见到他们喜欢的大陆明星
“中国新疆的历史与未来”国际论坛发言集萃
中国贸促会:美301调查无理无据 将组织行业企业进行法律抗辩
中国成品油价2024年首次下调
高原上的AI
第96届奥斯卡奖揭晓 《奥本海默》夺7奖成最大赢家
第二届全国青少年国防体育(山地户外)大赛开赛
气温下降 脑卒中风险加大 如何科学应对?一文了解→
16.xCC
18馃埐馃崋馃崒
se亚洲国产综合在线
精品国精品国产自在久国产不卡
亚洲性爱图片区
超碰人人干人人看
在线免费激情视频
国产古代无码a区在线视频
18成人视频
国产在线观看mmm

闽公网安备 35010302000113号