(4秒详细教程)999AV在线视频网苹果版v43.95.36.81.38.54-2265安卓网

k1体育麻将胡了

搜索 猫眼影戏 融媒体矩阵
  • 山东手机报

  • 猫眼影戏

  • 公共网官方微信

  • 公共网官方微博

  • 抖音

  • 人民号

  • 天下党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

美团龙猫手艺升级!新注重力机制速率快10倍,还能处置惩罚1M超长文本

2026-01-14 22:27:26
泉源:

猫眼影戏

作者:

卞立新

手机审查

  猫眼影戏记者 王文金 报道Q8X2R7L1T4J5M9B6W3

闻乐 发自 凹非寺量子位 | 公众号 QbitAI

256K文本预加载提速超50%,还解锁了1M上下文窗口。

美团龙猫LongCat系列新年出招,宣布全新希罕注重力机制LoZA(LongCat ZigZag Attention)

新手艺集中火力,重点解决长文本使命的明确、算力难题。

相比于LongCat系列之前的全注重力MLA机制,LoZA只改了一半的焦点 ?。

但模子长文本能力从256K扩展到1M,解码速率还快了不少。

甚至比同类型的Qwen-3模子体现还要好。

接下来看详细计划。

怎样做到 “只算要害部分” ?

全注重力机制的算力瓶颈在于平方级的盘算重漂后O (L?),这导致模子在处置惩罚长文本使命时对显卡要求高,还会泛起推理延迟问题。

LoZA的焦点思绪是专注于处置惩罚主要的内容,不主要的部分少花实力。

作为LongCat系列的焦点手艺升级,LoZA主要是在原来的MLA机制上做刷新。

详细分两步。

首先,给模子里的多头潜在注重力 ?镸LA做一个全局“筛查”,找出哪些 ?榭梢员凰⑿。

在原来的MLA架构中,每个MLA ?槎际谴χ贸头W⒅亓Φ慕沟愕ノ,现在的新计划是给每个 ?榕湟桓隹裳叭ㄖ卅。

α值越高,说明该 ?槎钊⒅亓ε趟阍揭,一旦简化就容易丢性能;α值越低就意味着 ?榈目商婊恍郧,即便换成更轻量的盘算方法,对整体的明确能力影响也不大。

在训练历程中,团队冻结模子其他参数,只更新α的梯度,通过这种专门的校准训练让模子自主学习α值,然后按α值从小到大排序,找出那些希罕化后不影响性能的MLA ?,也就是后续的优化目的。

随后,将找出的50%低性能 ?榛怀筛嵊牧魇较:弊⒅亓SA

这样就形成了一种交织结构,团队将这种结构称为ZigZag

SSA的盘算重漂后是线性的O (L·S)(S为希罕窗口巨细,牢靠为1024Token),远低于全注重力的O (L?)。

以是这种交织结构让模子既不会由于太过简化而变笨,又能把盘算重漂后降到线性级别,省不少算力。

为了让模子在关注局部细节的基础上不忽略整体逻辑,LoZA还设计了一个1024Token希罕窗口

每个窗口里有1个认真抓整体关联的“全局块”和7个认真盯周围内容的“局部块”,单块巨细为128Token。

这样的刷新也不需要重新训练,在中期训练阶段就能完成,本钱也较量低。

从测试数据来看,LoZA的体现也不错,主要是“更快”的同时“没变笨”

速率上,要是处置惩罚128K上下文,解码速率直接比原来快10倍;

256K上下文,模子预加载(读文本历程)速率快了50%,后续解码阶段天生内容时还能省30%的算力,相当于同样的硬件,现在能同时处置惩罚两倍多的长文本使命。

这也让LongCat-Flash-Exp解锁了1M上下文窗口。

性能上,LoZA也没由于简化而缩水。

处置惩罚回覆问题、写代码这类一样平常使命时,和原版LongCat-Flash持平;处置惩罚长文本使命时,体现反而更好。

好比在MRCR测试里,反超了同样能处置惩罚1M长文本的Qwen-3模子,还更稳固。

接下来,团队还妄想让LoZA支持动态希罕比例

随笔本场景自动多用全注重力包管精度,长文本场景自动增添希罕 ?樘嵘,甚至适配多模态模子处置惩罚长视频、长图文内容。

好一个新年新气象!

论文地点:https://www.alphaxiv.org/abs/2512.23966

— 完 —

??时势1:亚洲成色在线综合网站26

??01月14日,“五一”假期宁夏累计接待国内游客561.58万人次,

  4、西席要以备课组为单位全心选择训练题,要给学生提供适当的家庭作业,尤其是双休日的家庭作业要做到内容充分,形式多样,题量适当,以备学生使用双休日在家预习和;要强化检查环节,周一早要对周作业完成情形举行检查,检查后再举行有针对性讲评。西席要指导学生从最基础的事做起,上好每一节课,考好每一单位,让学生有一个厚实的学科基础,让“差生”有获得的可能。

,黄色网站A......8888黄色网站。

??01月14日,(巴黎奥运)体操男子双杠决赛:中国选手张博恒获第四名,

  每一分辛勤都有一分收获 ,每一次的痛苦都是快乐的最先。既然已走上了运动场,心里就不要多想,只管朝前走。你的汗水,洒在跑道,浇灌着乐成的花 朵;你的欢笑,飞扬在赛场,为班争光你最棒;你的身影是跑道上的景物,强壮的程序迈出你的自信!加油啊,健儿们!

,91久久艹,免费黄色的视频,欧美在线综合网。

??时势2:在线国产精品播放

??01月14日,2009年以来冬季最强雨雪冰冻天气来袭 中央气象台发布多个预警,

  数日后,小孤山镇不在清静,有人见到了大部落的一族之主,竟亲临这片土地,让那些为山宝而来的强者为之惊异。

,2020无码,国产一区二区三区不卡,特黄aa:级毛片视频在线播放。

??01月14日,四川与韩国全罗南道结好二十周年 双方盼合作再深化,

  不得不说,三只青鳞鹰都很有灵性,神异很是,通晓人性,对它们说什么都能听懂,只是不会说人语罢了。

,孕育的摇篮之卵2.7版本下,长途火车受孕之旅,亚洲一区二区三区中久无码。

??时势3:小 伸进 网站免费观看

??01月14日,【新春纪事】西藏山南扎西曲登社区:尽展“藏戏第一村”的“入戏”风貌,

  再来说说为什么会有这出“闹剧”的爆发?其缘故原由在于近年来中国的高速生长让有些国家看不下去了,他们视之为对他们自身职位的威胁和挑战。因此他们就想在我们周边搞出点事情来制约我们的生长,甚至倾覆我们的政权。而一旦让他们的阴谋得逞,那么中国将重新陷入上世纪二三十年月的时势,人民将重新回到水深火热之中。试想一下,等真的到了那一天我们还能像现在一样无忧无虑地、逍遥地生涯吗?回覆很显然是不可。以是自觉维护国家清静、体贴国防、加入国防建设关系到我们每小我私家的学习、事情和生涯。

,免费啪视频观在线视频无卡,女奥特曼绑腿和脚丫视频大全,人人曰人人。

??01月14日,两岸企业协同合作竞逐汽车产业新赛道,

  就在这时,雷族、罗浮大泽、金狼部落等几部人马似乎接到了什么下令,朝着山林涌去,此后紫山一脉的人也动了。

,黄色大片网站一级,你懂的免费看电影的网站,裸体美女性爱。

??时势4:先锋影音你懂的

??01月14日,【这个城市有点潮】上海:老街、弄堂里寻绚烂“繁花”,

改装手机“偷拍神器”在网上销售牟利,获刑!
,欧美在线看免费Ⅴa,四月丁香五月婷婷,在线观看免费无码毛片。

??01月14日,《繁花》热播牵出浙江金华火腿“沪上礼事”,

  银月炸碎,两头模糊的影子飞出,合在一起,略微真实了一些,化成一头恐怖的魔禽,展翅击天,冲向狈风。

,校草被当众脱裤玩j喷水,XXXmmm馃拫馃崒馃崋馃崙,99精品久久99久久久久。

【最高检:2024年前三季度公诉危险驾驶案件21.2万人】

【截至10月底 山西新增城镇就业43.33万人】

责编:彭宁莉

审核:米勒

责编:谢赫

相关推荐 换一换

    Copyright (C) 2001-   dzwww.com. All Rights Reserved

    新闻信息效劳允许证 - 音像制品出书允许证 - 广播电视节目制作谋划允许证 - 网络视听允许证 - 网络文化谋划允许证

    山东省互联网传媒集团主理  联系电话:0531-85193202  违法不良信息举报电话:0531-85196540

    鲁ICP备09023866号-1   鲁公网安备 37010202000111号  

    Copyright (C) 2001- Dzwww   鲁ICP备09023866号-1

    网站地图