猫眼影戏
猫眼影戏
向天笑
手机审查
猫眼影戏记者 郝洪 报道Q8X2R7L1T4J5M9B6W3
闻乐 发自 凹非寺量子位 | 公众号 QbitAI
256K文本预加载提速超50%,还解锁了1M上下文窗口。
美团龙猫LongCat系列新年出招,宣布全新希罕注重力机制LoZA(LongCat ZigZag Attention)
新手艺集中火力,重点解决长文本使命的明确、算力难题。
相比于LongCat系列之前的全注重力MLA机制,LoZA只改了一半的焦点?。
但模子长文本能力从256K扩展到1M,解码速率还快了不少。
甚至比同类型的Qwen-3模子体现还要好。
接下来看详细计划。
怎样做到 “只算要害部分” ?
全注重力机制的算力瓶颈在于平方级的盘算重漂后O (L?),这导致模子在处置惩罚长文本使命时对显卡要求高,还会泛起推理延迟问题。
LoZA的焦点思绪是专注于处置惩罚主要的内容,不主要的部分少花实力。
作为LongCat系列的焦点手艺升级,LoZA主要是在原来的MLA机制上做刷新。
详细分两步。
首先,给模子里的多头潜在注重力?镸LA做一个全局“筛查”,找出哪些?榭梢员凰⑿。
在原来的MLA架构中,每个MLA?槎际谴χ贸头W⒅亓Φ慕沟愕ノ,现在的新计划是给每个?榕湟桓隹裳叭ㄖ卅。
α值越高,说明该?槎钊⒅亓ε趟阍揭,一旦简化就容易丢性能;α值越低就意味着?榈目商婊恍郧,即便换成更轻量的盘算方法,对整体的明确能力影响也不大。
在训练历程中,团队冻结模子其他参数,只更新α的梯度,通过这种专门的校准训练让模子自主学习α值,然后按α值从小到大排序,找出那些希罕化后不影响性能的MLA?,也就是后续的优化目的。
随后,将找出的50%低性能?榛怀筛嵊牧魇较:弊⒅亓SA
这样就形成了一种交织结构,团队将这种结构称为ZigZag
SSA的盘算重漂后是线性的O (L·S)(S为希罕窗口巨细,牢靠为1024Token),远低于全注重力的O (L?)。
以是这种交织结构让模子既不会由于太过简化而变笨,又能把盘算重漂后降到线性级别,省不少算力。
为了让模子在关注局部细节的基础上不忽略整体逻辑,LoZA还设计了一个1024Token希罕窗口
每个窗口里有1个认真抓整体关联的“全局块”和7个认真盯周围内容的“局部块”,单块巨细为128Token。
这样的刷新也不需要重新训练,在中期训练阶段就能完成,本钱也较量低。
从测试数据来看,LoZA的体现也不错,主要是“更快”的同时“没变笨”
速率上,要是处置惩罚128K上下文,解码速率直接比原来快10倍;
256K上下文,模子预加载(读文本历程)速率快了50%,后续解码阶段天生内容时还能省30%的算力,相当于同样的硬件,现在能同时处置惩罚两倍多的长文本使命。
这也让LongCat-Flash-Exp解锁了1M上下文窗口。
性能上,LoZA也没由于简化而缩水。
处置惩罚回覆问题、写代码这类一样平常使命时,和原版LongCat-Flash持平;处置惩罚长文本使命时,体现反而更好。
好比在MRCR测试里,反超了同样能处置惩罚1M长文本的Qwen-3模子,还更稳固。
接下来,团队还妄想让LoZA支持动态希罕比例
随笔本场景自动多用全注重力包管精度,长文本场景自动增添希罕?樘嵘,甚至适配多模态模子处置惩罚长视频、长图文内容。
好一个新年新气象!
论文地点:https://www.alphaxiv.org/abs/2512.23966
— 完 —
??时势1:日韩AV黄色网址
??01月13日,2024潍坊国际旅游推介大会举行 挖掘旅游发展新资源,
四野,阒寂无声,不需要去证实,光从这些人进场的架势来看就知道是大人物,应是属于某巨族的长老等。
,苏晴忘穿内裤坐公交车被揉到视频。??01月13日,新能源汽车→油泼面、立柱架梁→联通万里,“钢铁驼队”有新变!,
狈山拔出巨剑,冲向小不点,冷森森的冷光在山林中划过,五六千斤的臂力凶猛的惊人,双手轮动阔剑,像是劈出了一道闪电。
,亚洲国产手机在线精品国偷产拍,欧美最性猛XXXXX(亚洲精品),又黄又涩的网站。??时势2:亚洲多毛
??01月13日,“五一”假期西宁市人民公园游客突破51万人次,
最后,预祝这次培训活动顺遂,预祝同志们在任职时代创立一流的业绩。
,巴巴塔奶球网战,成h黄色视频在线播放,色爽久久久久久亚洲射精。??01月13日,魏春荣:为传统昆曲探索当代表达,
“大人,早已查清,谁人孩子十有八九是替身,基础不可能是昔时谁人石昊。”有人仗着胆量回应道。
,伪娘deliver第一季的剧情简介,视频黄页网站,欧美A片短视频。??时势3:国产一级a爱视频在线
??01月13日,新疆喀什迎新年初雪,
然而,还没有等他行动,一条金色的通道泛起,将他直接就移走了。
,www.美女av.com,日本gay,美女干逼。??01月13日,企业缘何纷纷“看涨”广州?,
三个天才一起大战小不点,这个地方雷鸣陪同着麟吼,以及凶蛟的咆哮,震耳欲聋。
,成年免费大片黄在线观看地址91,海滩走光高清视频无奶罩内裤,99日韩午夜福利无码。??时势4:黄色网站在线收看
??01月13日,刘国中出席第三届南方首脑会议并致辞,
老树皮脱落,早先泛起突起的谁人地方,此时绿霞炽盛,钻出几条新枝,皆青翠欲滴,刹那间,又光雾氤氲,瑞彩万条。
,一级a毛一级a做视频免费,MSAV欧美在线播放,欧美AAAAAAAAAAAA。??01月13日,2023年安徽省粮食产量830.16亿斤 再创新高,
(四)组织了“同享书香情,共筑中国梦”图书大集“六一”庆;疃。本次活动为全体队员提供了自由交流、生意图书的平台,让学外行中的书籍流动起来,使学生在形式多样的图书流通中合理置换,学会资源共享,配合享受念书的快乐,让每一个孩子度过了一个体样的“六一”儿童节。
,国产一区 视频,日本黄色视频免费,18禁污幼幼呦呦污网站白丝足吊带白浆内射。责编:张大千
审核:覃某二
责编:彭小艾
Copyright (C) 2001- dzwww.com. All Rights Reserved
新闻信息效劳允许证 - 音像制品出书允许证 - 广播电视节目制作谋划允许证 - 网络视听允许证 - 网络文化谋划允许证
山东省互联网传媒集团主理 联系电话:0531-85193202 违法不良信息举报电话:0531-85196540
Copyright (C) 2001- Dzwww 鲁ICP备09023866号-1