首页
随着 LLM 向 1M 上下文演进,KV cache(键值缓存)已成为制约推理效劳效率的焦点瓶颈。自回归天生的特征使得模子必需存储历史 token 的 key-value 状态(即 KV cache)以阻止重复盘算,但 KV cache 的显存占用随着上下文长度的增添而膨胀,带来显著的内存瓶颈。
已往两年,关于 KV cache 的优化事情爆炸式增添,包括调理、迁徙、压缩等战略层出不穷。然而,现有综述主要聚焦于 LLM 推理或效劳的整体效率,大多仅将 KV cache 作为其中一个子?樽骷蛞致。
近期,来自墨尔本大学和华中科技大学的研究者们宣布了一篇深度综述,从MLSys 的头脑出发,用一套新颖的「时间 - 空间 - 结构」系统行为视角对 KV cache 优化要领举行了系统性梳理与深入剖析,并将相关资源整理成了一连维护的 Awesome 资源库,利便研究者与从业职员快速定位与落地。
论文地点: https://doi.org/10.36227/techrxiv.176046306.66521015/v3项目地点: https://github.com/jjiantong/Awesome-KV-Cache-Optimization
什么是「 sKis」?
为了提供更聚焦的视角和明确,作者们首先在综述中界说了sKis的界线:在推理效劳阶段,以 KV cache 为焦点优化工具,在不依赖模子重训或结构修改的条件下,提升吞吐、延迟等焦点系统指标。
从「系统行为」看 KV Cache
聚焦于 sKis,该综述立异性地提出以系统行为的视角来组织 KV cache 优化手艺:不是按详细流程、框架、算法来划分,而是按优化战略在系统中爆发的时间、空间、结构三个维度的行为来划分,从而更容易对齐工程实现与组合战略。
执行与调理(时间维度):KV 什么时间被会见和盘算?该分类关注执行历程与调理。例如设计以 KV 为中心的调理战略,接纳流水线来掩饰延迟,或者凭证差别硬件的特征适配操作等。安排与迁徙(空间维度):KV 放在那里、怎样迁徙?该分类关注数据的存储。例如在 GPU、CPU、SSD 组成的存储层级中怎样使热门 KV 留在 GPU 显存中,或者在漫衍式或异构的盘算装备中设计迁徙战略等。体现与留存(结构维度):KV 长什么样?该分类关注数据体现。这是现在最拥挤的赛道,包括量化、驱逐等论文麋集的子领域,旨在直接镌汰 KV cache 的物理体积。
基于上述三个维度,该综述将现有事情归纳为 7 个二级种别,详细包括:以 KV 为中心的调理(KVS)、流水线与重叠(OVLP)、硬件感知的执行(HAE)、跨内存层级的 KV 编排(MHO)、跨盘算装备的 KV 编排(CDO)、KV cache 压缩(KVCC)、KV cache 留存治理(KVRM)。
该论文不但详细梳理了每个维度下的差别类型和手艺要领,还为每一类提炼了要害要点、局限与权衡,给出了可落地的适用指导。
深度洞察与开放挑战
这篇综述最有价值的部分之一,在于作者们对百余篇论文举行了全局交织剖析,从而归纳了7 大概害视察,并引发了6 大开放挑战。
首先,作者们对文献举行了跨行为共现剖析,以展现差别维度的 KV 行为之间的内在联系和协同模式;别的,作者们深入剖析了KV 行为和优化目的的作用关系,并统计了文献中对相关优化指标的现实关注情形。
基于以上两类交织剖析,作者们展现了目今领域的7 大概害视察,例如什么组合是最常见的协同模式?结构维度(如量化)虽然论文最多,为什么往往沦为系统中的「孤岛」?
基于要害视察,作者们进一步提炼了6 大开放挑战,例如在追求效率的同时,我们虽然常;峁刈⒌蕉云渲柿康挠跋,可是否往往忽视了可信度(trustworthiness)的隐形崩塌?该综述中对每一个视察和挑战都给出了详细的剖析和思绪,期待能引发社区向着越发高效与可信的 LLM 效劳系统的一连探索!
资源分享:Awesome-KV-Cache-Optimization 资源库
为了利便社区追踪这一飞速生长的领域的最新希望,论文作者同步维护了一个 Awesome 气概的资源库,收录并一连更新 sKis 领域的最新论文和代码实现。希望这个资源库能让你少走弯路!
地点:https://github.com/jjiantong/Awesome-KV-Cache-Optimization
若是你正在做 LLM Infra、模子压缩或者高性能盘算等相关偏向,接待在 GitHub 上 star 支持,或者来客栈一起补全与更新!
《卡戴珊被 一区二区三区》,《Q8X2R7L1T4J5M9B6W3》有马芳彦skill我不想分手在线播放
“欧美性爱视屏”
h欧美在线
……
01月22日
“欧美日一级aa”羽生结弦 天与地的安魂曲
↓↓↓
01月22日,2023年以来江西警方为企挽损42.92亿元,白丝 jk 爆乳 作文,99色在线精品,日本特级淫片,精品久久一区
01月22日,安徽祁门:丝光椋鸟正成长,一级A做一级a做片视频,刺激黄页视频,操人人人人,97超碰人摸人人人澡人八
01月22日,三场小组赛一球未进,国足亚洲杯出线希望渺茫,,国产男靠女免费视频网站,欧美性视频一区二区,99精品69精品视频,色哟哟网站入口在线观看视频
01月22日|汤姆斯杯羽毛球团体赛:中国队胜马来西亚队 晋级决赛|啊啊啊啊 死我|安安老师裸体自慰|理伦自拍|日本免费大片
01月22日|云南普洱咖啡进入采收季|拖 摸 公交车|A片视频一区在线观看|又黄又硬又色的免费视频|大精鱼公社
01月22日|2024年冬春航季航班计划今起执行 部分票价同比下降7%|二女一杯食屎原版视|国产电影自拍91|无码屋精彩绝伦|白鹿裸体被 羞羞……
01月22日,深入推动长江经济带建设 “川—鄂—沪”长江班轮首航,高清无码b片,国产精品蜜芽在线观看,人人色视频,少另类老少欢
01月22日,柬埔寨国王西哈莫尼会见王毅,欧美国产日本日韩在线黄,久久久久久 小视频,婷婷激情五月综合另类图片,sanjipian.com
01月22日|广西友谊关公路口岸浦寨通道首票进境粮食顺利通关|一级毛片在线放|伊人网在线免费观看视频|外国AV在线|无码在线高清视频
01月22日,他们靠什么勇夺“金盾牌”,红桃传煤,99riAV久久精品re,激情久久网站,老师用丝袜脚摩擦jJJ
01月22日,法国凡尔赛宫短暂失火 数百名游客被疏散,一级男女黄段视频高清视频,久久精品一级A片免费观看,九九九精品视频在线观看6,一级黄色淫片
01月22日,广东省揭阳市1名干部被查,欧美欧美性暴力大黄A片,免费啪视频在线观看,在线视频一区二区三区亚太欧美,色噜噜Aⅴ在线
01月22日|中国驻美大使谢锋:中国是全球产供链绕不开的关键枢纽,孤立中国只会自我孤立|AV毛片导航|99re视频在线观看这里只有精品|都是激情国产在线|好爽好紧好大视频免费
01月22日|(乡村行·看振兴)山西黄河岸边上演速度与激情 农文体旅融合赋能乡村振兴|91精品高清黄色|97免费无码无码人妻视频|十八禁看爆乳|www,日本黄色视频
01月22日|民政部联合多部门打击整治非法社会组织 1100多家被处置、164个网站被关停|曰本三级片网站|黄色三级片日本久久国产|芙宁娜狂揉下部 羞羞动喷水|欧美福利视频呦呦
肖战首张实体黑胶我们,孙杨妻子发文感叹终于等到这一刻|澳门举行系列活动纪念五四运动105周年|美女在线视频综合视频|小萝脱裤子让我捅最新更新|梅花十三光溜溜的样子的漫画|久热这里电视剧免费观看
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
“我的企业我的家”
陕西迎来大范围降雪 部分景区闭园、高速封闭
陕西省气象台发布大雾黄色预警信号
中科卫星空天信息产业基地“落户”合肥 集中签约一批重点项目
中国汽车工业协会:对欧委会初裁结果表示强烈不满
未成年人文身,检察官出手联合治理
中国市场监管部门规范互联网广告可识别性
“中国民族工业发展史活标本”何以跨越一个多世纪?
“五一”餐饮市场火热 外卖成餐饮企业营收上涨重要渠道
《中国户外运动产业发展报告(2023-2024)》发布 消费市场活跃
福瑞18
熟女竹内梨惠AV一区
被操黄片视频
好爽⋯要高潮了⋯,小
欧洲一级A片大全
午夜男女视频免费播放
久久网av
xxxx视频在线观看
欧美人人操人人干
99久久国产精品免费热7788

闽公网安备 35010302000113号