欧美激情第1欧美精品,甜美诱惑让你心动不已,快来感受那份独特魅力

k1体育麻将胡了

搜索 猫眼影戏 融媒体矩阵
  • 山东手机报

  • 猫眼影戏

  • 公共网官方微信

  • 公共网官方微博

  • 抖音

  • 人民号

  • 天下党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

美团龙猫手艺升级!新注重力机制速率快10倍,还能处置惩罚1M超长文本

2026-01-13 17:22:27
泉源:

猫眼影戏

作者:

常辉

手机审查

  猫眼影戏记者 韩景媛 报道Q8X2R7L1T4J5M9B6W3

闻乐 发自 凹非寺量子位 | 公众号 QbitAI

256K文本预加载提速超50%,还解锁了1M上下文窗口。

美团龙猫LongCat系列新年出招,宣布全新希罕注重力机制LoZA(LongCat ZigZag Attention)

新手艺集中火力,重点解决长文本使命的明确、算力难题。

相比于LongCat系列之前的全注重力MLA机制,LoZA只改了一半的焦点?。

但模子长文本能力从256K扩展到1M,解码速率还快了不少。

甚至比同类型的Qwen-3模子体现还要好。

接下来看详细计划。

怎样做到 “只算要害部分” ?

全注重力机制的算力瓶颈在于平方级的盘算重漂后O (L?),这导致模子在处置惩罚长文本使命时对显卡要求高,还会泛起推理延迟问题。

LoZA的焦点思绪是专注于处置惩罚主要的内容,不主要的部分少花实力。

作为LongCat系列的焦点手艺升级,LoZA主要是在原来的MLA机制上做刷新。

详细分两步。

首先,给模子里的多头潜在注重力?镸LA做一个全局“筛查”,找出哪些?榭梢员凰⑿。

在原来的MLA架构中,每个MLA?槎际谴χ贸头W⒅亓Φ慕沟愕ノ,现在的新计划是给每个?榕湟桓隹裳叭ㄖ卅。

α值越高,说明该?槎钊⒅亓ε趟阍揭,一旦简化就容易丢性能;α值越低就意味着?榈目商婊恍郧,即便换成更轻量的盘算方法,对整体的明确能力影响也不大。

在训练历程中,团队冻结模子其他参数,只更新α的梯度,通过这种专门的校准训练让模子自主学习α值,然后按α值从小到大排序,找出那些希罕化后不影响性能的MLA?,也就是后续的优化目的。

随后,将找出的50%低性能?榛怀筛嵊牧魇较:弊⒅亓SA

这样就形成了一种交织结构,团队将这种结构称为ZigZag

SSA的盘算重漂后是线性的O (L·S)(S为希罕窗口巨细,牢靠为1024Token),远低于全注重力的O (L?)。

以是这种交织结构让模子既不会由于太过简化而变笨,又能把盘算重漂后降到线性级别,省不少算力。

为了让模子在关注局部细节的基础上不忽略整体逻辑,LoZA还设计了一个1024Token希罕窗口

每个窗口里有1个认真抓整体关联的“全局块”和7个认真盯周围内容的“局部块”,单块巨细为128Token。

这样的刷新也不需要重新训练,在中期训练阶段就能完成,本钱也较量低。

从测试数据来看,LoZA的体现也不错,主要是“更快”的同时“没变笨”

速率上,要是处置惩罚128K上下文,解码速率直接比原来快10倍;

256K上下文,模子预加载(读文本历程)速率快了50%,后续解码阶段天生内容时还能省30%的算力,相当于同样的硬件,现在能同时处置惩罚两倍多的长文本使命。

这也让LongCat-Flash-Exp解锁了1M上下文窗口。

性能上,LoZA也没由于简化而缩水。

处置惩罚回覆问题、写代码这类一样平常使命时,和原版LongCat-Flash持平;处置惩罚长文本使命时,体现反而更好。

好比在MRCR测试里,反超了同样能处置惩罚1M长文本的Qwen-3模子,还更稳固。

接下来,团队还妄想让LoZA支持动态希罕比例

随笔本场景自动多用全注重力包管精度,长文本场景自动增添希罕?樘嵘,甚至适配多模态模子处置惩罚长视频、长图文内容。

好一个新年新气象!

论文地点:https://www.alphaxiv.org/abs/2512.23966

— 完 —

??时势1:一级做a影片a在线视频中文字幕

??01月13日,海地超36万人流离失所 居民艰难寻求避难之处,

  “长风破浪会有时,直挂云帆济沧海”,新兴的标记房产期待着各人一如既往地支持。

,激情 欧美 日韩。

??01月13日,上海市两会观察:数字科技融合文创,如何催生新消费模式?,

  “天和是什么工具?老天收不了我!”凶禽重大的身躯挤满了天空,用力拍翅,欲将这天地动的四分五裂,狂风着述,整片天地都一片漆黑。

,三级视频又爽又硬,变性后蹲尿感觉小妹妹早期图片,99在线一区。

??时势2:啊 老公顶到了好痛 嗯 轻一点

??01月13日,三部门联合发文 新型电力系统建设提速,

  恶魔嘶吼,离火滔天,云烟电芒交织,这个地方欢喜,三头远古遗种对决,响声震天动地,震撼了大荒。

,欧美精,3d不知火舞 自慰喷水爽,成年人视频www。

??01月13日,山西将迎持续降雪天气 或影响春运返程,

  “一连了两年啊,远古遗种还没有离去,值得去探讨,要弄清晰究竟是什么,不过想来一定会有许多人前往。”

,在线综合色,免费91最新地址永久入口,有黄有色视频网站。

??时势3:一路向西电影免费观看在线高清中文字幕

??01月13日,两部门:严厉打击网络中盗墓、探墓、非法鉴定等相关违法违规短视频和直播活动,

  为什么远古凶兽强盛?还在幼崽时期就那么逆天,远超凡俗,有如神话般,跟这些也分不开!

,国产一级特大黄片久久99,欧美日韩综合在线网站,人人操色五月。

??01月13日,中国最新完成7次“奋斗者”号载人深潜作业 最深达7735.9米,

  “先不要剖析了,只要他们不过分,照旧不要血拼才好,生涯在这片山脉中都禁止易。”一位族老道。

,婬黄大片欧美看国产片,www.scjchy.com,13禁 游戏。

??时势4:欧美伊人久久大香线蕉综合

??01月13日,斯洛伐克国家交响乐团南昌首场演出 奏响“新年乐章”,

  见到穿山甲召唤鳞片,小不点又祭出了另一种至强宝术,一轮银月升空,当中孕着一头远古魔禽,斩向祭灵。

,国产美女色色电影,色秀视频在线观看,www.cao23.com新网站。

??01月13日,以军军事情报局局长辞职,

  四野,巨狼嚎叫,一直偷袭,村人很危险,疲于应付。

,欧美性电影在线,亚洲女子牲交视频免费观看,日本免费www。

责编:普利亚

审核:陈见飞

责编:安工大

相关推荐 换一换

Copyright (C) 2001-   dzwww.com. All Rights Reserved

新闻信息效劳允许证 - 音像制品出书允许证 - 广播电视节目制作谋划允许证 - 网络视听允许证 - 网络文化谋划允许证

山东省互联网传媒集团主理  联系电话:0531-85193202  违法不良信息举报电话:0531-85196540

鲁ICP备09023866号-1   鲁公网安备 37010202000111号  

Copyright (C) 2001- Dzwww   鲁ICP备09023866号-1

网站地图