首页
随着 LLM 向 1M 上下文演进,KV cache(键值缓存)已成为制约推理效劳效率的焦点瓶颈。自回归天生的特征使得模子必需存储历史 token 的 key-value 状态(即 KV cache)以阻止重复盘算,但 KV cache 的显存占用随着上下文长度的增添而膨胀,带来显著的内存瓶颈。
已往两年,关于 KV cache 的优化事情爆炸式增添,包括调理、迁徙、压缩等战略层出不穷。然而,现有综述主要聚焦于 LLM 推理或效劳的整体效率,大多仅将 KV cache 作为其中一个子?樽骷蛞致。
近期,来自墨尔本大学和华中科技大学的研究者们宣布了一篇深度综述,从MLSys 的头脑出发,用一套新颖的「时间 - 空间 - 结构」系统行为视角对 KV cache 优化要领举行了系统性梳理与深入剖析,并将相关资源整理成了一连维护的 Awesome 资源库,利便研究者与从业职员快速定位与落地。
论文地点: https://doi.org/10.36227/techrxiv.176046306.66521015/v3项目地点: https://github.com/jjiantong/Awesome-KV-Cache-Optimization
什么是「 sKis」?
为了提供更聚焦的视角和明确,作者们首先在综述中界说了sKis的界线:在推理效劳阶段,以 KV cache 为焦点优化工具,在不依赖模子重训或结构修改的条件下,提升吞吐、延迟等焦点系统指标。
从「系统行为」看 KV Cache
聚焦于 sKis,该综述立异性地提出以系统行为的视角来组织 KV cache 优化手艺:不是按详细流程、框架、算法来划分,而是按优化战略在系统中爆发的时间、空间、结构三个维度的行为来划分,从而更容易对齐工程实现与组合战略。
执行与调理(时间维度):KV 什么时间被会见和盘算?该分类关注执行历程与调理。例如设计以 KV 为中心的调理战略,接纳流水线来掩饰延迟,或者凭证差别硬件的特征适配操作等。安排与迁徙(空间维度):KV 放在那里、怎样迁徙?该分类关注数据的存储。例如在 GPU、CPU、SSD 组成的存储层级中怎样使热门 KV 留在 GPU 显存中,或者在漫衍式或异构的盘算装备中设计迁徙战略等。体现与留存(结构维度):KV 长什么样?该分类关注数据体现。这是现在最拥挤的赛道,包括量化、驱逐等论文麋集的子领域,旨在直接镌汰 KV cache 的物理体积。
基于上述三个维度,该综述将现有事情归纳为 7 个二级种别,详细包括:以 KV 为中心的调理(KVS)、流水线与重叠(OVLP)、硬件感知的执行(HAE)、跨内存层级的 KV 编排(MHO)、跨盘算装备的 KV 编排(CDO)、KV cache 压缩(KVCC)、KV cache 留存治理(KVRM)。
该论文不但详细梳理了每个维度下的差别类型和手艺要领,还为每一类提炼了要害要点、局限与权衡,给出了可落地的适用指导。
深度洞察与开放挑战
这篇综述最有价值的部分之一,在于作者们对百余篇论文举行了全局交织剖析,从而归纳了7 大概害视察,并引发了6 大开放挑战。
首先,作者们对文献举行了跨行为共现剖析,以展现差别维度的 KV 行为之间的内在联系和协同模式;别的,作者们深入剖析了KV 行为和优化目的的作用关系,并统计了文献中对相关优化指标的现实关注情形。
基于以上两类交织剖析,作者们展现了目今领域的7 大概害视察,例如什么组合是最常见的协同模式?结构维度(如量化)虽然论文最多,为什么往往沦为系统中的「孤岛」?
基于要害视察,作者们进一步提炼了6 大开放挑战,例如在追求效率的同时,我们虽然常;峁刈⒌蕉云渲柿康挠跋,可是否往往忽视了可信度(trustworthiness)的隐形崩塌?该综述中对每一个视察和挑战都给出了详细的剖析和思绪,期待能引发社区向着越发高效与可信的 LLM 效劳系统的一连探索!
资源分享:Awesome-KV-Cache-Optimization 资源库
为了利便社区追踪这一飞速生长的领域的最新希望,论文作者同步维护了一个 Awesome 气概的资源库,收录并一连更新 sKis 领域的最新论文和代码实现。希望这个资源库能让你少走弯路!
地点:https://github.com/jjiantong/Awesome-KV-Cache-Optimization
若是你正在做 LLM Infra、模子压缩或者高性能盘算等相关偏向,接待在 GitHub 上 star 支持,或者来客栈一起补全与更新!
《97超碰人妻在线》,《Q8X2R7L1T4J5M9B6W3》草草视频福利
“花10000初一女生高考成绩”
爱尻屄小说
……
01月19日
“男生自慰 免费青少年”我心里危险的东西 第二季
↓↓↓
01月19日,图览 | 芬兰总统访华,“圣诞老人的故乡”,与中国如何结缘?,一级黄色片视频网站,蘑菇tv传媒官网页,美女裸体 开腿玩小玩具,馃崋馃崋馃崋馃崙馃崙馃崚
01月19日,美再对华半导体实施出口管制 商务部:中方将采取必要措施,日本免费淫荡视频,原创国产,porin卅蹏賷睾蹏乇,搞B乱轮片
01月19日,法院支持爱心人士监护,“野娃儿”开心了,一级aα片,自拍偷拍黄色网站,苏语棠苏娅元宵猜灯谜免费观看,巨乳无码噜噜噜久久久
01月19日|山西襄汾出土晋国贵族墓 陪葬器物折射诸侯国关系|一边一边一级片一级片一级片非级片|中文字幕亚洲|另类小说图片|亚洲欧美小视频
01月19日|古井贡酒“固态白酒智能化酿造5G工厂”获工信部认定|色网站免费|少萝喷水|最新日韩黄色网站|激情性爱视频小说与图片
01月19日|第二届“京津冀协同发展杯”公路自行车邀请赛河北大厂开赛|欧美一级a爱做片天天视频|虞书欣疯狂 喷水自慰|白鹿被我强插了一晚18|三角洲黄片……
01月19日,福建暑期文旅经济火爆 台胞冀两岸年轻人共同传承中华优秀传统文化,二区性爱偷拍,捆绑裸体美女,欧美性一交激情视频在线,26uuu偷拍亚洲欧洲综合32
01月19日,广东多口岸出入境客流迎来大幅增长,蔴荳传禖mv视频,一级一级片一级一级片,99riav三宫,直接免费观看黄色的网页
01月19日|“春之声·金梦想”跨国新春文艺晚会加德满都上演:中尼跨越雪山 携手迎春|国产精品久久久厕所偷窥盗摄|又粗又猛又黄又爽无遮挡免费|小怪兽面具公社|青青青久久97碰碰经典
01月19日,赵乐际在十四届全国人大二次会议上发表讲话,各肿4p网3紅大呱 等↓你↓来开f i ↓弟兄们 速度k上p車,18黄网站,国产18禁免费观看在网址wwww91日,我要看aa aa a级黄片
01月19日,【巴黎奥运会】徐嘉余:我们向来遵守规则,不找借口,克服困难,一级aa免费毛片高潮,亚洲色图27p,欧美啪啪啪,欧美黑人福利在线导航
01月19日,23人被问责 山西公布增子坊煤矿一般机电事故调查报告,欧洲黄片儿免费观看,在线观看黄网站看,国产igao为爱做激情在线观看,正在播放女人99久久久品
01月19日|南京大屠杀幸存者刘素珍去世 享年93岁|国产国产精品人在线观看|求饶TK一视频丨Ⅴk|国内产偷拍|免费观看欧美日韩黄色视频
01月19日|海南公布民营企业50强 营收规模较上年增长超50%|亚洲涩图偷拍|男高潮爽到尿都喷出来了|18xxoo|猛弄HD老太婆老熟女
01月19日|外企观两会 | “中国绿”为外企添活力|骚仙子被玩烂了h|91精品啪在线观看国产老人令品|国产福利在线导航|主播喷水
曼城若罪名坐实将被罚降级要久久爱,伊朗防空系统密集拦截袭击|第四届网络空间内生安全学术大会举办在即|最新毛片发布地址|淫荡少妇白洁骚浪贱|XNXXX中国👙👙23|色欧美美女性爱
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
海南首条往返英国货运航线开通
日本诹访之濑岛火山发生较大规模喷发
中国(新疆、香港)—哈萨克斯坦合作对接会举行
时政微观察丨新征程金融工作怎么干?“新年第一课”这样讲
莫言对话古尔纳:关于讲故事的人
辽宁古城中的“龙抬头” 特色美食、满族小吃一应俱全
“五一”假期前3天广东重点景区接待游客791.9万人次
两部门联合出台政策 推动中央企业创业投资基金高质量发展
美国阿肯色州前州长哈钦森退出总统竞选
国内罕见!陕西汉中发现完整度较高的大熊猫化石
国产一级av在线免费播放
网站
欧美日韩亚
欧美女同视频三级黄色
4444色视频
黄色91黄页网
黄色片免费看久久
国产三级视频在线观看播放
亚洲综合激情另类小说区
小蝶荫蒂添的好舒服h绿帽

闽公网安备 35010302000113号