首页
随着 LLM 向 1M 上下文演进,KV cache(键值缓存)已成为制约推理效劳效率的焦点瓶颈。自回归天生的特征使得模子必需存储历史 token 的 key-value 状态(即 KV cache)以阻止重复盘算,但 KV cache 的显存占用随着上下文长度的增添而膨胀,带来显著的内存瓶颈。
已往两年,关于 KV cache 的优化事情爆炸式增添,包括调理、迁徙、压缩等战略层出不穷。然而,现有综述主要聚焦于 LLM 推理或效劳的整体效率,大多仅将 KV cache 作为其中一个子?樽骷蛞致。
近期,来自墨尔本大学和华中科技大学的研究者们宣布了一篇深度综述,从MLSys 的头脑出发,用一套新颖的「时间 - 空间 - 结构」系统行为视角对 KV cache 优化要领举行了系统性梳理与深入剖析,并将相关资源整理成了一连维护的 Awesome 资源库,利便研究者与从业职员快速定位与落地。
论文地点: https://doi.org/10.36227/techrxiv.176046306.66521015/v3项目地点: https://github.com/jjiantong/Awesome-KV-Cache-Optimization
什么是「 sKis」?
为了提供更聚焦的视角和明确,作者们首先在综述中界说了sKis的界线:在推理效劳阶段,以 KV cache 为焦点优化工具,在不依赖模子重训或结构修改的条件下,提升吞吐、延迟等焦点系统指标。
从「系统行为」看 KV Cache
聚焦于 sKis,该综述立异性地提出以系统行为的视角来组织 KV cache 优化手艺:不是按详细流程、框架、算法来划分,而是按优化战略在系统中爆发的时间、空间、结构三个维度的行为来划分,从而更容易对齐工程实现与组合战略。
执行与调理(时间维度):KV 什么时间被会见和盘算?该分类关注执行历程与调理。例如设计以 KV 为中心的调理战略,接纳流水线来掩饰延迟,或者凭证差别硬件的特征适配操作等。安排与迁徙(空间维度):KV 放在那里、怎样迁徙?该分类关注数据的存储。例如在 GPU、CPU、SSD 组成的存储层级中怎样使热门 KV 留在 GPU 显存中,或者在漫衍式或异构的盘算装备中设计迁徙战略等。体现与留存(结构维度):KV 长什么样?该分类关注数据体现。这是现在最拥挤的赛道,包括量化、驱逐等论文麋集的子领域,旨在直接镌汰 KV cache 的物理体积。
基于上述三个维度,该综述将现有事情归纳为 7 个二级种别,详细包括:以 KV 为中心的调理(KVS)、流水线与重叠(OVLP)、硬件感知的执行(HAE)、跨内存层级的 KV 编排(MHO)、跨盘算装备的 KV 编排(CDO)、KV cache 压缩(KVCC)、KV cache 留存治理(KVRM)。
该论文不但详细梳理了每个维度下的差别类型和手艺要领,还为每一类提炼了要害要点、局限与权衡,给出了可落地的适用指导。
深度洞察与开放挑战
这篇综述最有价值的部分之一,在于作者们对百余篇论文举行了全局交织剖析,从而归纳了7 大概害视察,并引发了6 大开放挑战。
首先,作者们对文献举行了跨行为共现剖析,以展现差别维度的 KV 行为之间的内在联系和协同模式;别的,作者们深入剖析了KV 行为和优化目的的作用关系,并统计了文献中对相关优化指标的现实关注情形。
基于以上两类交织剖析,作者们展现了目今领域的7 大概害视察,例如什么组合是最常见的协同模式?结构维度(如量化)虽然论文最多,为什么往往沦为系统中的「孤岛」?
基于要害视察,作者们进一步提炼了6 大开放挑战,例如在追求效率的同时,我们虽然常;峁刈⒌蕉云渲柿康挠跋,可是否往往忽视了可信度(trustworthiness)的隐形崩塌?该综述中对每一个视察和挑战都给出了详细的剖析和思绪,期待能引发社区向着越发高效与可信的 LLM 效劳系统的一连探索!
资源分享:Awesome-KV-Cache-Optimization 资源库
为了利便社区追踪这一飞速生长的领域的最新希望,论文作者同步维护了一个 Awesome 气概的资源库,收录并一连更新 sKis 领域的最新论文和代码实现。希望这个资源库能让你少走弯路!
地点:https://github.com/jjiantong/Awesome-KV-Cache-Optimization
若是你正在做 LLM Infra、模子压缩或者高性能盘算等相关偏向,接待在 GitHub 上 star 支持,或者来客栈一起补全与更新!
《free性满足HD性BWW》,《Q8X2R7L1T4J5M9B6W3》免费毛片手机无码毛视频
“送妻子去农场配马当媳妇”
亚洲综合欧美
……
01月20日
“秀人免费”李子柒回归
↓↓↓
01月20日,哈马斯否认对停火提议有修改意见,国产AV剧情无码精品色午夜,韩日黄色网站,99偷拍视频系列5,亚洲Aⅴ在线无码播放毛片涩爱
01月20日,巴基斯坦外交部谴责伊朗侵犯领空造成人员伤亡,午夜特黄AAA片在线视频,国产女孩精品专区,国产精品第三页,91guochan
01月20日,福建福州:数字技术助力“建筑医生”把脉文物,一 级 黄 色 片69强奸一级片,国产乱伦不卡免费视频,黄色电影在线影院,狼友视频免费看
01月20日|香港逾200名政商界人士探讨企业ESG策略|城乡居民养老保险交多少年|欧美 大码 变态 另类|色呦呦免费在线观看|日本三级带黄
01月20日|川藏青藏公路建成通车70周年|奋战高原、扎根高原 他们用热血青春述说忠诚与担当|免费看A片不卡|插插射射狠狠干|另类AV天堂永久综合资源在线|经典偷拍
01月20日|北京将加强科技创新和产业创新协同 发展新质生产力|青cao在线观看|主人请好好疼爱第二季在线观看|jxcc的最新版本更新内容是什么|湖北青年电商人才……
01月20日,厦门港首条“大三通”跨境电商海运快线搭建起两岸经贸合作新桥梁,蓝莓视频18,涩图无码,13小男生GAY自慰脱裤子网站,欧美人兽狗操熟妇
01月20日,26名台胞青年走进重庆抗战遗址博物馆参观,特黄视频中文字幕,精品国产高清一区二区,印度人乄乄乂,人人操人人插人人操
01月20日|中方对日本众议院选举有何评论?外交部回应|国产一级牲交视频|女性裸体秘 不遮胸平台|男女网|久草
01月20日,伊拉克民兵武装称袭击伊叙境内三处美军基地,免费一级欧美黄片99,十八岁禁国产美女,日韩2AV影院,精品视频在线精品视频在线
01月20日,印尼总统候选人各显“奇招”吸引年轻选民,国产一区在线视频免费观看,在线观看va视频网站,九九影院按摩视频,中韩高清无矿
01月20日,AI能代替诗人写诗吗?听听诗人怎么说,精品九九99久久免费九九,黄色动漫下载,开心婷婷激激情av,V888Vm视频
01月20日|跪地的小德、复出的薛晨、首闯决赛的黄博凯……赛场上哪一幕让你难忘?|国产免费二级视频|91少女玩乳吃奶动漫|欧美性爱吧在线|国产一级a爱做片777
01月20日|走进“中国竹蒸笼之乡”:寻找那抹餐桌上的清香|久99久视频精选|女女九九一区二区|黄色视频毛片a|国产麻豆口爆吞精视频
01月20日|攀岩亚少赛、全国青攀联赛相继在四川眉山举行|妹妹用 夹我的 网站第四|天天射日日操|小樱扒开 让鸣人蘑菇视频|8x8x2019最新网咨
浙江神秘80后捅了个62亿的窟窿,如何评价腾讯的怪猎手游?|湖南娄底山区开“耕读集市” “蔬香”换“书香”助乡村孩子圆阅读梦|免费的印度少女体内射视频|久碰|丝袜 强奸乱伦 尼龙袜亚洲|免费下载欧美一级视频
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
韩国民众谈“戒严令”风波:希望好好安定下来
00后大学生做起互联网“新农人”:售出12万件农资,给26万“老铁”讲致富经
激活“文化+智造”双螺旋基因 让年轻人越来越爱中国造
探访浙中怀鲁村:“东阳马生”的“孔子情怀”
巴黎掠影
习近平抵达爱丽舍宫 法国总统马克龙热情迎接
辽宁省技能精英冲刺全国乡村振兴职业技能大赛
聚焦当前安全风险防范工作 北京发布紧急通知
跟着总书记探寻中华文明|荆楚之声 古今交响
日本股市暴跌!创下史上最大跌幅
国内自拍色色色色
人人爽,人人操
无码小电影片在线观看
男生插女生鸡动漫
女人草吊一级黄色视频
触手pla
萝莉喷水自慰
国产乱老熟视频胖女人
欧美女生喷水网站在线观看
午夜天堂AV天堂久久久

闽公网安备 35010302000113号