猫眼影戏
猫眼影戏
修竣
手机审查
猫眼影戏记者 金安平 报道Q8X2R7L1T4J5M9B6W3
闻乐 发自 凹非寺量子位 | 公众号 QbitAI
256K文本预加载提速超50%,还解锁了1M上下文窗口。
美团龙猫LongCat系列新年出招,宣布全新希罕注重力机制LoZA(LongCat ZigZag Attention)
新手艺集中火力,重点解决长文本使命的明确、算力难题。
相比于LongCat系列之前的全注重力MLA机制,LoZA只改了一半的焦点?。
但模子长文本能力从256K扩展到1M,解码速率还快了不少。
甚至比同类型的Qwen-3模子体现还要好。
接下来看详细计划。
怎样做到 “只算要害部分” ?
全注重力机制的算力瓶颈在于平方级的盘算重漂后O (L?),这导致模子在处置惩罚长文本使命时对显卡要求高,还会泛起推理延迟问题。
LoZA的焦点思绪是专注于处置惩罚主要的内容,不主要的部分少花实力。
作为LongCat系列的焦点手艺升级,LoZA主要是在原来的MLA机制上做刷新。
详细分两步。
首先,给模子里的多头潜在注重力?镸LA做一个全局“筛查”,找出哪些?榭梢员凰⑿。
在原来的MLA架构中,每个MLA?槎际谴χ贸头W⒅亓Φ慕沟愕ノ,现在的新计划是给每个?榕湟桓隹裳叭ㄖ卅。
α值越高,说明该?槎钊⒅亓ε趟阍揭,一旦简化就容易丢性能;α值越低就意味着?榈目商婊恍郧,即便换成更轻量的盘算方法,对整体的明确能力影响也不大。
在训练历程中,团队冻结模子其他参数,只更新α的梯度,通过这种专门的校准训练让模子自主学习α值,然后按α值从小到大排序,找出那些希罕化后不影响性能的MLA?,也就是后续的优化目的。
随后,将找出的50%低性能?榛怀筛嵊牧魇较:弊⒅亓SA
这样就形成了一种交织结构,团队将这种结构称为ZigZag
SSA的盘算重漂后是线性的O (L·S)(S为希罕窗口巨细,牢靠为1024Token),远低于全注重力的O (L?)。
以是这种交织结构让模子既不会由于太过简化而变笨,又能把盘算重漂后降到线性级别,省不少算力。
为了让模子在关注局部细节的基础上不忽略整体逻辑,LoZA还设计了一个1024Token希罕窗口
每个窗口里有1个认真抓整体关联的“全局块”和7个认真盯周围内容的“局部块”,单块巨细为128Token。
这样的刷新也不需要重新训练,在中期训练阶段就能完成,本钱也较量低。
从测试数据来看,LoZA的体现也不错,主要是“更快”的同时“没变笨”
速率上,要是处置惩罚128K上下文,解码速率直接比原来快10倍;
256K上下文,模子预加载(读文本历程)速率快了50%,后续解码阶段天生内容时还能省30%的算力,相当于同样的硬件,现在能同时处置惩罚两倍多的长文本使命。
这也让LongCat-Flash-Exp解锁了1M上下文窗口。
性能上,LoZA也没由于简化而缩水。
处置惩罚回覆问题、写代码这类一样平常使命时,和原版LongCat-Flash持平;处置惩罚长文本使命时,体现反而更好。
好比在MRCR测试里,反超了同样能处置惩罚1M长文本的Qwen-3模子,还更稳固。
接下来,团队还妄想让LoZA支持动态希罕比例
随笔本场景自动多用全注重力包管精度,长文本场景自动增添希罕?樘嵘,甚至适配多模态模子处置惩罚长视频、长图文内容。
好一个新年新气象!
论文地点:https://www.alphaxiv.org/abs/2512.23966
— 完 —
??时势1:XX❌❌BBB000X❌
??01月16日,中芭《天鹅湖》亮相香港 再现芭蕾经典,
村人没有妄动,神色暗澹,差别就是差别,他们真的难以抗衡,远不是这群凶寇的敌手。
,起点。??01月16日,浙江提引领改革新目标 2035年实现“三个再”“五个更”,
“天啊,远古遗种来袭!”
,美女www视频在线观看,日本黄色软件在线观看,性别隐凸轮和隐凸轮的区别。??时势2:骇爪涩图
??01月16日,“2024北大报告”发布2024年度文化产业十大趋势预测,
蛟龙着实太重大了,只管被洞穿,精气神迅速消逝,可是它依旧在张牙舞爪,横舞天地间,喷吐曦光,攻击下方。石村四野,造到了恐怖性的攻击,山林消逝,乱石横飞,大地龟裂。
,免费看A级电影,国产 专区 自拍,XXXXXX泡妞 视频免费。??01月16日,浙江文旅推介会在纽约举行,
现在,我们学;蛏缁嶂,不;で樾,破损公物的人越来越多。在广场上,人们在喷泉里乱跑、甚至把垃圾就扔在喷泉里;在学校里,有的同砚践踏草坪;在课堂里,有的同砚在雪白雪白的墙壁上乱写乱画……
,久久99思思热精品手机免费视频,亚洲免费在线观看自拍视频在线观看,秦彻外网漫画免费观看。??时势3:欧美老熟妇熟女叉叉叉
??01月16日,公安部公布重庆警方依法打击整治网络谣言10起典型案例 ,
“这是灵族?”补天阁的几位师兄变色,他们相相互互看了一眼,都不禁动容。
?第一百九十八章 回石村,黄色视频9999,重口秘 猎奇50度灰,国产黄色激情网站。??01月16日,西部陆海新通道法商融合发展论坛在重庆举行,
同砚们好!很幸运作为西席代表在此讲话!
,向日葵草莓芭乐鸭脖,人插人人操人,亚洲黄色网站在线播放。??时势4:国产v自拍
??01月16日,侨领侨青相约南宁 助力广西打造粤港澳大湾区重要战略腹地,
上午好!本学期的家长会又准期召开了,在此,我向列位家长的到来体现最真诚的谢谢。谢谢你们的对学校的支持、明确和信任。今天,我们欢聚一堂,共商您孩子的生长大计在这个特别的日子里,我讲话的问题是“以人为本,走协调生长之路”。
,男人天堂网在线观看视频,免费黄片视频不用下载,男同的 伸到 里面无挡。??01月16日,巴西男子劫持公交车幸无人员伤亡,
“这次应该没差了吧?”他轻声自语。
,AAaAA一区二区,宅福利蜜桃社无圣光,崩坏3搞黄羞羞视频。责编:叶霞翟
审核:孙佳佳
责编:朱顶红
Copyright (C) 2001- Dzwww 鲁ICP备09023866号-1