首页
随着 LLM 向 1M 上下文演进,KV cache(键值缓存)已成为制约推理效劳效率的焦点瓶颈。自回归天生的特征使得模子必需存储历史 token 的 key-value 状态(即 KV cache)以阻止重复盘算,但 KV cache 的显存占用随着上下文长度的增添而膨胀,带来显著的内存瓶颈。
已往两年,关于 KV cache 的优化事情爆炸式增添,包括调理、迁徙、压缩等战略层出不穷。然而,现有综述主要聚焦于 LLM 推理或效劳的整体效率,大多仅将 KV cache 作为其中一个子?樽骷蛞致。
近期,来自墨尔本大学和华中科技大学的研究者们宣布了一篇深度综述,从MLSys 的头脑出发,用一套新颖的「时间 - 空间 - 结构」系统行为视角对 KV cache 优化要领举行了系统性梳理与深入剖析,并将相关资源整理成了一连维护的 Awesome 资源库,利便研究者与从业职员快速定位与落地。
论文地点: https://doi.org/10.36227/techrxiv.176046306.66521015/v3项目地点: https://github.com/jjiantong/Awesome-KV-Cache-Optimization
什么是「 sKis」?
为了提供更聚焦的视角和明确,作者们首先在综述中界说了sKis的界线:在推理效劳阶段,以 KV cache 为焦点优化工具,在不依赖模子重训或结构修改的条件下,提升吞吐、延迟等焦点系统指标。
从「系统行为」看 KV Cache
聚焦于 sKis,该综述立异性地提出以系统行为的视角来组织 KV cache 优化手艺:不是按详细流程、框架、算法来划分,而是按优化战略在系统中爆发的时间、空间、结构三个维度的行为来划分,从而更容易对齐工程实现与组合战略。
执行与调理(时间维度):KV 什么时间被会见和盘算?该分类关注执行历程与调理。例如设计以 KV 为中心的调理战略,接纳流水线来掩饰延迟,或者凭证差别硬件的特征适配操作等。安排与迁徙(空间维度):KV 放在那里、怎样迁徙?该分类关注数据的存储。例如在 GPU、CPU、SSD 组成的存储层级中怎样使热门 KV 留在 GPU 显存中,或者在漫衍式或异构的盘算装备中设计迁徙战略等。体现与留存(结构维度):KV 长什么样?该分类关注数据体现。这是现在最拥挤的赛道,包括量化、驱逐等论文麋集的子领域,旨在直接镌汰 KV cache 的物理体积。
基于上述三个维度,该综述将现有事情归纳为 7 个二级种别,详细包括:以 KV 为中心的调理(KVS)、流水线与重叠(OVLP)、硬件感知的执行(HAE)、跨内存层级的 KV 编排(MHO)、跨盘算装备的 KV 编排(CDO)、KV cache 压缩(KVCC)、KV cache 留存治理(KVRM)。
该论文不但详细梳理了每个维度下的差别类型和手艺要领,还为每一类提炼了要害要点、局限与权衡,给出了可落地的适用指导。
深度洞察与开放挑战
这篇综述最有价值的部分之一,在于作者们对百余篇论文举行了全局交织剖析,从而归纳了7 大概害视察,并引发了6 大开放挑战。
首先,作者们对文献举行了跨行为共现剖析,以展现差别维度的 KV 行为之间的内在联系和协同模式;别的,作者们深入剖析了KV 行为和优化目的的作用关系,并统计了文献中对相关优化指标的现实关注情形。
基于以上两类交织剖析,作者们展现了目今领域的7 大概害视察,例如什么组合是最常见的协同模式?结构维度(如量化)虽然论文最多,为什么往往沦为系统中的「孤岛」?
基于要害视察,作者们进一步提炼了6 大开放挑战,例如在追求效率的同时,我们虽然常;峁刈⒌蕉云渲柿康挠跋,可是否往往忽视了可信度(trustworthiness)的隐形崩塌?该综述中对每一个视察和挑战都给出了详细的剖析和思绪,期待能引发社区向着越发高效与可信的 LLM 效劳系统的一连探索!
资源分享:Awesome-KV-Cache-Optimization 资源库
为了利便社区追踪这一飞速生长的领域的最新希望,论文作者同步维护了一个 Awesome 气概的资源库,收录并一连更新 sKis 领域的最新论文和代码实现。希望这个资源库能让你少走弯路!
地点:https://github.com/jjiantong/Awesome-KV-Cache-Optimization
若是你正在做 LLM Infra、模子压缩或者高性能盘算等相关偏向,接待在 GitHub 上 star 支持,或者来客栈一起补全与更新!
《大香蕉视频一区二区三区》,《Q8X2R7L1T4J5M9B6W3》7788色淫免费视频
“成人18秘 视频免费69”
91免费观看高清版视频在线
……
01月21日
“老色鬼超碰人人操”鞠婧祎发了韩菱纱的墓碑
↓↓↓
01月21日,首次公开!侵华日军731部队再添新罪证,亚洲粗大视频,久久h视频,欧美白人与白人作爱A片,绝区零妮可乳液爆插
01月21日,四川甘孜州:稻城亚丁牛奶海如蓝宝石镶嵌群山,国产高色高清一级黄色a片视频,色噜噜狠狠狠狠色综合久一,另类A婷婷综合在线,日逼视频网
01月21日,【巴黎奥运会】中国体育代表团:应对个别出现失误运动员给予理解,小透明kissc0splay大长腿,摸人人操人人人,男女浴室猛烈后式动态图,天天色天天爽
01月21日|博鳌亚洲论坛2024年年会定于3月26日至29日举行|老美AⅤ|婷婷热|国产专区免费AV无码|www.91久久
01月21日|中国经济向前“进”丨增长6.1%!传统产业加快转型从“芯”开始|你懂得的在线视频|精品免费看|Free少妇性野战HD|超碰女人在线
01月21日|长春推出系列优惠政策吸引高校毕业生等青年群体|影音先锋小说资源|国产va在线在线观看视频|光溜溜女孩视频大全2025年8月|好大轻点……
01月21日,澳网首轮:中国军团4人晋级,www.51av,性饥渴艳妇k8经典A片,在线看av一图,www日本黄色片 www.lzhibao.com
01月21日,【巴黎奥运会】专访“吊环王”刘洋:金牌是30岁生日礼物 希望而立之年继续努力,日韩在线免费网址,在线女同网站,龙口护士无删减55分钟国语版,免费黄片观看
01月21日|宁夏前7个月举办会展博览活动实现产值42.28亿元|久久久久我们这里只有|亚洲性爱无码视频|敖闰免费无遮挡 视频网站|18禁无遮挡啪啪无码网站
01月21日,扎实推进禁毒斗争 不断推动禁毒工作取得新成效,性感尤物高清无码一区二区三区,欧美专区_第1页,天天日天天操天天爽,3571性欧美视频在线观看
01月21日,品味文化盛宴 “五一”文博热持续升温,欧美一级视在试,寄宿日记第32话在珊珊炙热的嘴里,女 8 ∞,狼友在线免费视频图片
01月21日,世界经济论坛2024年年会开幕在即,少妇一区二区三区,火影忍者小樱吃大狙,国产AV无码专区,草久久黄色视频
01月21日|【风起黄埔】黄埔后人忆杨应彬:他是最后撤离的“特支”成员 一生充满传奇|欧美视频第一区|91免费在线免费|永久官网特级黄色视频|第四色激情小说
01月21日|中华社会救助基金会关注高原肺动脉高压病 为青海患者捐赠药物|91中文字幕在线观看视频|欧美a一级片|欧美三级电影在线免费观看|亚洲人人
01月21日|以“四链融合”助力高质量发展|97碰碰人妻无码视频免费|久色网址|国产XXwwXXww视频|欧美猛少妇色XXXX.
早让秦海璐当导游 秦岚嗓子早好了,西班牙数万人抗议过度旅游|万物皆可飞上天!老外眼中的潍坊国际风筝节|激情无码国产精品|色涩啪射草|亚洲男人无码一区二区|茜特菈莉18本子无码最新更新内容
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
2023年存款利率经历3轮较大幅度下调—— 银行理财市场如何抓住机遇
韩国总统尹锡悦发布紧急戒严令
贺一诚会见中国银行澳门分行行长贾天兵一行
清华珠三角研究院未来设计创新中心广州揭牌
《中国婚礼通志》发布 《中华岁时通志》启动出版
青海发布3万多个就业岗位助高校毕业生就业创业
公安部公布6起打击整治非法制售“特供酒”犯罪“净风”专项行动典型案例
河南郑州发布大雾黄色预警 局地能见度小于200米
江西鄱阳湖南矶湿地:“观鸟热”带动旅游热 村民乐享生态红利
湖南国际班列开年“加速跑” 赋能产业经济
日韩欧美高清dvd碟片
二级黄片免费播放
久久久国产999
800凹凸在线观看网站
黄 色 视 频 免 费 观 看
又硬又粗的黄色网站
中文字幕国产综合
做爱视频阴道
久久的99视频
美女裸体视频免费观看国产

闽公网安备 35010302000113号