Av无码一级A片在线播放,内容丰富,界面简洁,无论新手还是高手都能轻松上手

k1体育麻将胡了

搜索 猫眼影戏 融媒体矩阵
  • 山东手机报

  • 猫眼影戏

  • 公共网官方微信

  • 公共网官方微博

  • 抖音

  • 人民号

  • 天下党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

美团龙猫手艺升级!新注重力机制速率快10倍 ,还能处置惩罚1M超长文本

2026-01-19 02:10:39
泉源:

猫眼影戏

作者:

连江路—福

手机审查

  猫眼影戏记者 马科夫金 报道Q8X2R7L1T4J5M9B6W3

闻乐 发自 凹非寺量子位 | 公众号 QbitAI

256K文本预加载提速超50% ,还解锁了1M上下文窗口。

美团龙猫LongCat系列新年出招 ,宣布全新希罕注重力机制LoZA(LongCat ZigZag Attention)

新手艺集中火力 ,重点解决长文本使命的明确、算力难题。

相比于LongCat系列之前的全注重力MLA机制 ,LoZA只改了一半的焦点 ?。

但模子长文本能力从256K扩展到1M ,解码速率还快了不少。

甚至比同类型的Qwen-3模子体现还要好。

接下来看详细计划。

怎样做到 “只算要害部分”  ?

全注重力机制的算力瓶颈在于平方级的盘算重漂后O (L?) ,这导致模子在处置惩罚长文本使命时对显卡要求高 ,还会泛起推理延迟问题。

LoZA的焦点思绪是专注于处置惩罚主要的内容 ,不主要的部分少花实力。

作为LongCat系列的焦点手艺升级 ,LoZA主要是在原来的MLA机制上做刷新。

详细分两步。

首先 ,给模子里的多头潜在注重力 ?镸LA做一个全局“筛查” ,找出哪些 ?榭梢员凰⑿。

在原来的MLA架构中 ,每个MLA ?槎际谴χ贸头W⒅亓Φ慕沟愕ノ ,现在的新计划是给每个 ?榕湟桓隹裳叭ㄖ卅。

α值越高 ,说明该 ?槎钊⒅亓ε趟阍揭 ,一旦简化就容易丢性能 ;α值越低就意味着 ?榈目商婊恍郧 ,即便换成更轻量的盘算方法 ,对整体的明确能力影响也不大。

在训练历程中 ,团队冻结模子其他参数 ,只更新α的梯度 ,通过这种专门的校准训练让模子自主学习α值 ,然后按α值从小到大排序 ,找出那些希罕化后不影响性能的MLA ? ,也就是后续的优化目的。

随后 ,将找出的50%低性能 ?榛怀筛嵊牧魇较:弊⒅亓SA

这样就形成了一种交织结构 ,团队将这种结构称为ZigZag

SSA的盘算重漂后是线性的O (L·S)(S为希罕窗口巨细 ,牢靠为1024Token) ,远低于全注重力的O (L?)。

以是这种交织结构让模子既不会由于太过简化而变笨 ,又能把盘算重漂后降到线性级别 ,省不少算力。

为了让模子在关注局部细节的基础上不忽略整体逻辑 ,LoZA还设计了一个1024Token希罕窗口

每个窗口里有1个认真抓整体关联的“全局块”和7个认真盯周围内容的“局部块” ,单块巨细为128Token。

这样的刷新也不需要重新训练 ,在中期训练阶段就能完成 ,本钱也较量低。

从测试数据来看 ,LoZA的体现也不错 ,主要是“更快”的同时“没变笨”

速率上 ,要是处置惩罚128K上下文 ,解码速率直接比原来快10倍 ;

256K上下文 ,模子预加载(读文本历程)速率快了50% ,后续解码阶段天生内容时还能省30%的算力 ,相当于同样的硬件 ,现在能同时处置惩罚两倍多的长文本使命。

这也让LongCat-Flash-Exp解锁了1M上下文窗口。

性能上 ,LoZA也没由于简化而缩水。

处置惩罚回覆问题、写代码这类一样平常使命时 ,和原版LongCat-Flash持平 ;处置惩罚长文本使命时 ,体现反而更好。

好比在MRCR测试里 ,反超了同样能处置惩罚1M长文本的Qwen-3模子 ,还更稳固。

接下来 ,团队还妄想让LoZA支持动态希罕比例

随笔本场景自动多用全注重力包管精度 ,长文本场景自动增添希罕 ?樘嵘 ,甚至适配多模态模子处置惩罚长视频、长图文内容。

好一个新年新气象!

论文地点:https://www.alphaxiv.org/abs/2512.23966

— 完 —

??时势1:国产三级视频在线播放

??01月19日,执掌“童话王国”半个世纪后,丹麦女王正式退位,

  “阿叔 ,再捉的话它们就要惊逃了 ,以后可能再也不会回来了 ,等我驯服这头独角兽 ,好好待它 ,让它感受到我们的善意 ,以后说未必其他独角兽见到后也会自动靠近我们。”

,亚洲AⅤ免费在线。

??01月19日,双汇携手小红书亮相慢人音乐节 用美味开启“慢生活”,

  “少族主我们照旧退吧 ,不然会有灭族大祸。”有人劝道。

,婷婷久久麻豆,日韩三级av片,国内下药视频在线观看。

??时势2:俄罗斯大毛逼AⅤ女优黄色录像

??01月19日,谁来规范无人机飞手培训收费,

北京社保医疗就医不必选也能报销的定点医院
,偷偷超碰中文字幕,赵微被操120分钟,吴梦梦高潮流白浆视频。

??01月19日,广东中山出逃鳄鱼已找回3条 剩余1条在布控范围内,

  究竟谁是人类 ,谁是远古遗种 ?银色生灵有点神经庞杂的感受 ,怎么两小我私家的种族像是置换了过来 ?!

,黄色视频网站在线观看,美国AA片,又黄又硬的视频。

??时势3:欧美一级特级AAAA片免费观看

??01月19日,中短途客流增加 “五一”假期客流量持续保持高位运行,

  五要体现与时俱进。新一届的村党(总)支部书记、村主任绝大大都都是连选连任 ,虽然都有富厚的履历 ,但一些头脑方法、促生长的思绪已跟不上时代和生长的需要 ,这就要求我们进一步解放头脑 ,与时俱进 ,把自己的头脑境界提升一个条理 ,面临新形势下镇村干部面临的使命 ,尤其是通过在经济转型期面临的种种重大时势 ,彻底转变用已往的老要领、老头脑事情和处置惩罚问题的被动时势 ,变头脑、变要领 ,顺时乘势、尽职尽责 ,为构建协调板桥、推动全镇经济社会又好又快生长做出应作的孝顺。

,黄视频免费在线视频观看,免费在线黄片免费,国产在线激情免费视频。

??01月19日,民航局:我国航空货运量规模达到历史最好水平,

  他以凡人难以想象的爆发力 ,腾跃向天 ,不但凌驾了石毅的那座山峰 ,并且也凌驾了另一座灰褐色的大山。

?第九十五章 成为传说,国产精品群交电影在线免费观看,亚洲黄色片网站视频,北京网络欧美在线日韩在线。

??时势4:亚洲最大黄色网站 下载

??01月19日,判处有期徒刑三年 李佩霞受贿案一审宣判,

  小不点发慌 ,鼓着腮帮子 ,气呼呼隧道:“你们别笑 ,那可是一只全身赤红如血的雀儿 ,像极了骨书上纪录的远古神鸟朱雀。”

,91女教师裙子趴开掰开射,欧美一区二区性交,538在线国内精品视频。

??01月19日,美国华人病理医生王焕友:探寻临床诊断“金标准”,

  2、增进房地产市场一连康健生长 ,有利于加速城镇化历程。加速城镇化历程、全方位谋划都会、深入推进"三个转变" ,是我省贯彻落实党的xx大和xx届三中全会精神、周全建设小康社会的主要战略和必由之路。房地产市场的一连康健生长 ,能够为加速城镇化提供必需的住房等生涯要素和商业、办公、工业用房等生产要素。房地工业既是支持谋划都会的工业之一 ,也是推进土地资源向土地资源转变、民间资金向民间资源转变的一个主要载体和生力军。据统计 ,去年全省房地产开发谋划购置土地面积为20xx万平方米 ,约占全省谋划性用地供应总面积的60% ,购置土地用度达86亿元 ,同比增添35.3% ,是推动土地资源向土地资源转变的一个市场主体。同期 ,我省房地产开发企业注册资笔菩 ,约73%为民营资源 ,总额达278亿元 ,非公有制房地产开发企业完成投资399亿元 ,占全省房地产开发完成投资总额的89% ,有力地推动了民间资金向民间资源转变。增进房地产市场一连康健生长 ,将使房地工业在加速城镇化、实验谋划都会战略、深入推进"三个转变"中进一步施展主要作用。

,精品自拍视频,国产黄一区,国产伦理视频精品,一区二区三区。

责编:方建华

审核:武邱

责编:王伶

相关推荐 换一换

    Copyright (C) 2001-   dzwww.com. All Rights Reserved

    新闻信息效劳允许证 - 音像制品出书允许证 - 广播电视节目制作谋划允许证 - 网络视听允许证 - 网络文化谋划允许证

    山东省互联网传媒集团主理  联系电话:0531-85193202  违法不良信息举报电话:0531-85196540

    鲁ICP备09023866号-1   鲁公网安备 37010202000111号  

    Copyright (C) 2001- Dzwww   鲁ICP备09023866号-1

    网站地图