首页
随着 LLM 向 1M 上下文演进,KV cache(键值缓存)已成为制约推理效劳效率的焦点瓶颈。自回归天生的特征使得模子必需存储历史 token 的 key-value 状态(即 KV cache)以阻止重复盘算,但 KV cache 的显存占用随着上下文长度的增添而膨胀,带来显著的内存瓶颈。
已往两年,关于 KV cache 的优化事情爆炸式增添,包括调理、迁徙、压缩等战略层出不穷。然而,现有综述主要聚焦于 LLM 推理或效劳的整体效率,大多仅将 KV cache 作为其中一个子?樽骷蛞致。
近期,来自墨尔本大学和华中科技大学的研究者们宣布了一篇深度综述,从MLSys 的头脑出发,用一套新颖的「时间 - 空间 - 结构」系统行为视角对 KV cache 优化要领举行了系统性梳理与深入剖析,并将相关资源整理成了一连维护的 Awesome 资源库,利便研究者与从业职员快速定位与落地。
论文地点: https://doi.org/10.36227/techrxiv.176046306.66521015/v3项目地点: https://github.com/jjiantong/Awesome-KV-Cache-Optimization
什么是「 sKis」?
为了提供更聚焦的视角和明确,作者们首先在综述中界说了sKis的界线:在推理效劳阶段,以 KV cache 为焦点优化工具,在不依赖模子重训或结构修改的条件下,提升吞吐、延迟等焦点系统指标。
从「系统行为」看 KV Cache
聚焦于 sKis,该综述立异性地提出以系统行为的视角来组织 KV cache 优化手艺:不是按详细流程、框架、算法来划分,而是按优化战略在系统中爆发的时间、空间、结构三个维度的行为来划分,从而更容易对齐工程实现与组合战略。
执行与调理(时间维度):KV 什么时间被会见和盘算?该分类关注执行历程与调理。例如设计以 KV 为中心的调理战略,接纳流水线来掩饰延迟,或者凭证差别硬件的特征适配操作等。安排与迁徙(空间维度):KV 放在那里、怎样迁徙?该分类关注数据的存储。例如在 GPU、CPU、SSD 组成的存储层级中怎样使热门 KV 留在 GPU 显存中,或者在漫衍式或异构的盘算装备中设计迁徙战略等。体现与留存(结构维度):KV 长什么样?该分类关注数据体现。这是现在最拥挤的赛道,包括量化、驱逐等论文麋集的子领域,旨在直接镌汰 KV cache 的物理体积。
基于上述三个维度,该综述将现有事情归纳为 7 个二级种别,详细包括:以 KV 为中心的调理(KVS)、流水线与重叠(OVLP)、硬件感知的执行(HAE)、跨内存层级的 KV 编排(MHO)、跨盘算装备的 KV 编排(CDO)、KV cache 压缩(KVCC)、KV cache 留存治理(KVRM)。
该论文不但详细梳理了每个维度下的差别类型和手艺要领,还为每一类提炼了要害要点、局限与权衡,给出了可落地的适用指导。
深度洞察与开放挑战
这篇综述最有价值的部分之一,在于作者们对百余篇论文举行了全局交织剖析,从而归纳了7 大概害视察,并引发了6 大开放挑战。
首先,作者们对文献举行了跨行为共现剖析,以展现差别维度的 KV 行为之间的内在联系和协同模式;别的,作者们深入剖析了KV 行为和优化目的的作用关系,并统计了文献中对相关优化指标的现实关注情形。
基于以上两类交织剖析,作者们展现了目今领域的7 大概害视察,例如什么组合是最常见的协同模式?结构维度(如量化)虽然论文最多,为什么往往沦为系统中的「孤岛」?
基于要害视察,作者们进一步提炼了6 大开放挑战,例如在追求效率的同时,我们虽然常;峁刈⒌蕉云渲柿康挠跋,可是否往往忽视了可信度(trustworthiness)的隐形崩塌?该综述中对每一个视察和挑战都给出了详细的剖析和思绪,期待能引发社区向着越发高效与可信的 LLM 效劳系统的一连探索!
资源分享:Awesome-KV-Cache-Optimization 资源库
为了利便社区追踪这一飞速生长的领域的最新希望,论文作者同步维护了一个 Awesome 气概的资源库,收录并一连更新 sKis 领域的最新论文和代码实现。希望这个资源库能让你少走弯路!
地点:https://github.com/jjiantong/Awesome-KV-Cache-Optimization
若是你正在做 LLM Infra、模子压缩或者高性能盘算等相关偏向,接待在 GitHub 上 star 支持,或者来客栈一起补全与更新!
《色一情一乱一伦一区二区》,《Q8X2R7L1T4J5M9B6W3》姐姐直播WWW
“永久免费黄色综合网站”
河南美女中学生破处性做爱免费观看
……
01月21日
“www.773c.cn免费网站入口申请退款”JDG零封RNG
↓↓↓
01月21日,第二届链博会在知识产权保护上做到“四个提升、一个拓展”,成年免费A片视频黄网站在线观看,爱搞在线,淫淫五月天 亚洲色图,nc18嫩草入口
01月21日,2024年CBA夏季联赛(青岛)落幕 青岛男篮主场夺冠,橘子喵酱西施花絮,92在线视频免费观看,天堂中文在线www天堂在线,91精品啪在线观看国产日本
01月21日,广西公安闻“雪”而动 全力护航民众安全,欧美老妇人性交网,免费人成网站视频,国产日韩内射高清视频,福利姬旧版本
01月21日|中新教育丨贵州推出“冬季研学大礼包” 让“研学游”实现“研学优”|馃悢馃悢馃悢|林书辞6部视频完整版|日韩A片综合视频|色色色色色4房色
01月21日|海普瑞遭遇A股史上最大电信诈骗,涉案近亿,律师表示追回难度大|iGAO视频网站入口在哪|中文一级黄片精品|国产一极毛片在线看|佐伊的兔子洞plus正版
01月21日|总书记的这个倡议,既有大工程也有“小而美”|直接看黄网址|亚洲是图13P|成人论理三级网|在线呦交网站在线观看……
01月21日,股价一度跌超20%,恒大汽车国内三家生产基地均已停产,欧美极品福利一区二区三区,英语老师赤裸奶头屁股无遮挡,免费人人干人人操,男人的 伸到 里拔
01月21日,如何预防亚硝酸盐中毒?|科普时间美民调:超6成美国人称物价上涨让家庭面临经济困难,精品人妻无码专区在线,av毛片免费在线观看,日本黄大片一区二区三区,电影网午夜理论片
01月21日|中国医学发展大会上,专家建议建立多学科融通式医学教育体系|国产一区二区视频在线播放|加勒比中文字幕一区综合在线|黄页视频网站免费观看安全|欧美一级做一级a做片性视频黑人
01月21日,云南临沧:打造铸牢中华民族共同体意识宣传教育体系,国产真实熟女被爆,欧美区在线观看,无码啪啪网站,看男生和女生操逼软件
01月21日,日本股市创最大涨幅 盘中一度涨到“熔断”,好吊色A片在线观看视频,97AAA免费视频在线,免费观看国产黄网站在线,娇小性爱高清管
01月21日,湖南多部门联动战冰雪 对铁路重点区域全时段打冰扫雪,喷射九七人人操,9999热视频精品,一本大道香蕉久29在线看黄,亚洲欧美黑人性暴力猛交群
01月21日|中国各地游客齐聚广西山城观美景赏民俗|日本a在线h|jizz美女丝袜国产免费|AAAAA黄色网站AAAAA|国产福利色
01月21日|湘台青年企业家融合发展大会在长沙举行|久久不卡日韩A片|操人人操人人爽爽爽操操操|玖玖爱在线观看精品视频|超碰首页
01月21日|习言道 | 建设绿色家园是人类的共同梦想|超碰激情|男男0被 出白浆|好吊操人人操|国产精品自拍无码
TheShy和Rookie被曝回归iG,孩子光脚被地面烫到两轮变四驱|2024年知名侨商云南行活动启动|玖玖视频网址在线|8C2CCn|最近中文字幕免费大全在线|曰夲少妇╳╳ HD
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
安理会讨论乌克兰儿童生存状况 中方代表呼吁化解冲突 让儿童免于战乱
关锦鹏忆《阮玲玉》幕后:张曼玉为进入角色自愿剃光眉毛
爱国卫生月:儿童如何保持健康体重?专家支招
李强出席世界经济论坛午餐会
套上秒变阳澄湖大闸蟹?起底“假蟹扣”制售链
中基协:7月ABS新增备案规模逾1000亿元
黑龙江:“立夏”未夏 黑河伊春等5地市最高温18℃
四川康定山洪泥石流灾害已致12人遇难、15人失联
寻亲家庭陪伴杨妞花在贵州老家为外婆庆生
“熊猫杯”中国慢垒联赛分站赛结束 超万人参赛
涩涩的网站
人人乐人人爽人人爱免费
在线视频亚洲
香蕉成人app 破解版下载
性交电影在线播放
免费看毛片88
亚洲人成网站在线在线观看国产
国剧情丝综合网
国产性爱免费在线
绿帽社在线

闽公网安备 35010302000113号