首页
闻乐 发自 凹非寺量子位 | 公众号 QbitAI
256K文本预加载提速超50%,还解锁了1M上下文窗口。
美团龙猫LongCat系列新年出招,宣布全新希罕注重力机制LoZA(LongCat ZigZag Attention)
新手艺集中火力,重点解决长文本使命的明确、算力难题。
相比于LongCat系列之前的全注重力MLA机制,LoZA只改了一半的焦点?。
但模子长文本能力从256K扩展到1M,解码速率还快了不少。
甚至比同类型的Qwen-3模子体现还要好。
接下来看详细计划。
怎样做到 “只算要害部分” ?
全注重力机制的算力瓶颈在于平方级的盘算重漂后O (L?),这导致模子在处置惩罚长文本使命时对显卡要求高,还会泛起推理延迟问题。
LoZA的焦点思绪是专注于处置惩罚主要的内容,不主要的部分少花实力。
作为LongCat系列的焦点手艺升级,LoZA主要是在原来的MLA机制上做刷新。
详细分两步。
首先,给模子里的多头潜在注重力?镸LA做一个全局“筛查”,找出哪些?榭梢员凰⑿。
在原来的MLA架构中,每个MLA?槎际谴χ贸头W⒅亓Φ慕沟愕ノ,现在的新计划是给每个?榕湟桓隹裳叭ㄖ卅。
α值越高,说明该?槎钊⒅亓ε趟阍揭,一旦简化就容易丢性能;α值越低就意味着?榈目商婊恍郧,即便换成更轻量的盘算方法,对整体的明确能力影响也不大。
在训练历程中,团队冻结模子其他参数,只更新α的梯度,通过这种专门的校准训练让模子自主学习α值,然后按α值从小到大排序,找出那些希罕化后不影响性能的MLA?,也就是后续的优化目的。
随后,将找出的50%低性能?榛怀筛嵊牧魇较:弊⒅亓SA
这样就形成了一种交织结构,团队将这种结构称为ZigZag
SSA的盘算重漂后是线性的O (L·S)(S为希罕窗口巨细,牢靠为1024Token),远低于全注重力的O (L?)。
以是这种交织结构让模子既不会由于太过简化而变笨,又能把盘算重漂后降到线性级别,省不少算力。
为了让模子在关注局部细节的基础上不忽略整体逻辑,LoZA还设计了一个1024Token希罕窗口
每个窗口里有1个认真抓整体关联的“全局块”和7个认真盯周围内容的“局部块”,单块巨细为128Token。
这样的刷新也不需要重新训练,在中期训练阶段就能完成,本钱也较量低。
从测试数据来看,LoZA的体现也不错,主要是“更快”的同时“没变笨”
速率上,要是处置惩罚128K上下文,解码速率直接比原来快10倍;
256K上下文,模子预加载(读文本历程)速率快了50%,后续解码阶段天生内容时还能省30%的算力,相当于同样的硬件,现在能同时处置惩罚两倍多的长文本使命。
这也让LongCat-Flash-Exp解锁了1M上下文窗口。
性能上,LoZA也没由于简化而缩水。
处置惩罚回覆问题、写代码这类一样平常使命时,和原版LongCat-Flash持平;处置惩罚长文本使命时,体现反而更好。
好比在MRCR测试里,反超了同样能处置惩罚1M长文本的Qwen-3模子,还更稳固。
接下来,团队还妄想让LoZA支持动态希罕比例
随笔本场景自动多用全注重力包管精度,长文本场景自动增添希罕?樘嵘,甚至适配多模态模子处置惩罚长视频、长图文内容。
好一个新年新气象!
论文地点:https://www.alphaxiv.org/abs/2512.23966
— 完 —
《久久网免费视频》,《Q8X2R7L1T4J5M9B6W3》a天v堂2019免费网站
“福利片”
你操综合
……
01月17日
“欧美在线二区”多地房地产项目白名单落地
↓↓↓
01月17日,2024碳达峰碳中和论坛暨深圳国际低碳城论坛开幕,亚洲操B网,国产伦久视频免费观看视频,国产欧美精品图片久久久,成人重口猎奇专区
01月17日,在巴黎,34名“外教”与中国弟子共逐奥运梦,久久久久久久 精品,xxxx23欧美性,jizzjizz在线观看,人成网站免费看
01月17日,中国驻慕尼黑总领馆再次提醒领区中国公民注意防范极端天气,张婧仪裸被 视频,国产黄片在现免费观看久久,欧美日韩在线社区,禁漫漫堂jmcomic入口
01月17日|辽宁省博士后事业高质量发展 累计招收万余人|亚洲图片欧美足控在线不卡视频|私人综合一级看片|99riav.6|18 出水
01月17日|潘岳:多元一体在新疆|白白发布在线视频精品|亚洲黄色网也|国产aaaaa黄色网站|免费黄网址
01月17日|丁纯任安徽省黄山市委书记|小萝裸乳 码 遮在线观看|国产免费黄色在线网站|韩婧格打扑克原视频在线看|台湾艳女自由A片……
01月17日,马克龙:将致力于“更强大、更公平的法国”,河娃极速版最新更新,观看一级在线黄色视频,自拍偷拍 色,色欲AⅤ免费视频
01月17日,山西供电部门多举措应对降雪天气 特巡检修同步开展,美女裸体视频下载软件,罗峰C巴巴塔的网站,变态操逼视频,欧洲成在人线免费视频a
01月17日|“桂中粮仓”风吹稻浪美如画卷|欧美福利色|凹凸紧身裤看到lB毛馒头视频|亚洲色精品一区二区三AI女星|免费全黄一级AAAA片
01月17日,中俄美术联盟首届大会在哈尔滨举行 两国高校艺术作品展同期开幕,黄色网站视频免费看在线,美女黄色网站黄色工厂,欧美又粗又大又爽,一级aa免费无码视频
01月17日,上海:夜景再升级 苏州河普陀段两岸景观照明三期工程竣工,JIZZZZ在线无码观看,亚洲无码做性视频,免费观看无码毛片,亚洲AV㊙️无码一区羽田あい
01月17日,今年荔枝同比减产或将超四成 专家:量少价会涨,男女激情猛烈啪啦啦动态图,猎奇av,干大屁股,操人免费
01月17日|国际最新研究:澳大利亚草原古人类对火行为的影响始于1.1万年前|黄片毛片爽|台湾AA在线|曰本三级片|荒野乱斗r34奖励图片
01月17日|(高质量发展调研行)乡村何以“种出”新质生产力?民企入乡“浇水施肥”输养分|男女性色大片免費看|低头看我怎么C你|动漫美女怼逼内射视频|亚韩欧美永久中文字幕视频
01月17日|侨乡新征程|保山“侨味”餐馆见证四十余年生活变迁|恶德医生和产妇人科医师|把 伸到女人 打扑克|人人操人人洗|在线午夜精品视频
到了30岁还是处男,似乎会变成魔法师,曝《古墓丽影》新作将以印度为背景|西藏青少年民族传统马术赛在拉萨精彩上演|兔费欧美一级A片在线观看|一级毛片一级毛片一级毛片一级毛片视频播放|你懂的 国产 在线|D2天堂忘忧草
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
“剩菜盲盒”流行,食品安全要抓紧
安徽黄山:雪落土楼
哈里斯选择明尼苏达州州长沃尔兹为其竞选搭档
(高质量发展调研行)走进浙江杭州谢径安·传化农创村
通讯:中国漫瀚调亮相巴黎记
中国大同文化交流团访问友城日本大牟田市
粤港澳大湾区企业家联盟东盟三国分会成立
2023年山西产煤13.78亿吨 先进产能占比超80%
贵州“村超”“村BA”流量变现 “五一”假期持续火爆
哈尔滨变“天然大冰箱” 各类“冻货”摆上街头
日韩www色在线视频
性欧美暴力猛交另类HD
免费一级大片
性交3xxxxx在线观看
4455vs永久亚洲
免费α√一A级高清无码毛片在线观看
肛交动画3d
乱伦无码论坛
国产激情一二区
成人男人露jiji网站自慰

闽公网安备 35010302000113号