首页
随着 LLM 向 1M 上下文演进,KV cache(键值缓存)已成为制约推理效劳效率的焦点瓶颈。自回归天生的特征使得模子必需存储历史 token 的 key-value 状态(即 KV cache)以阻止重复盘算,但 KV cache 的显存占用随着上下文长度的增添而膨胀,带来显著的内存瓶颈。
已往两年,关于 KV cache 的优化事情爆炸式增添,包括调理、迁徙、压缩等战略层出不穷。然而,现有综述主要聚焦于 LLM 推理或效劳的整体效率,大多仅将 KV cache 作为其中一个子?樽骷蛞致。
近期,来自墨尔本大学和华中科技大学的研究者们宣布了一篇深度综述,从MLSys 的头脑出发,用一套新颖的「时间 - 空间 - 结构」系统行为视角对 KV cache 优化要领举行了系统性梳理与深入剖析,并将相关资源整理成了一连维护的 Awesome 资源库,利便研究者与从业职员快速定位与落地。
论文地点: https://doi.org/10.36227/techrxiv.176046306.66521015/v3项目地点: https://github.com/jjiantong/Awesome-KV-Cache-Optimization
什么是「 sKis」?
为了提供更聚焦的视角和明确,作者们首先在综述中界说了sKis的界线:在推理效劳阶段,以 KV cache 为焦点优化工具,在不依赖模子重训或结构修改的条件下,提升吞吐、延迟等焦点系统指标。
从「系统行为」看 KV Cache
聚焦于 sKis,该综述立异性地提出以系统行为的视角来组织 KV cache 优化手艺:不是按详细流程、框架、算法来划分,而是按优化战略在系统中爆发的时间、空间、结构三个维度的行为来划分,从而更容易对齐工程实现与组合战略。
执行与调理(时间维度):KV 什么时间被会见和盘算?该分类关注执行历程与调理。例如设计以 KV 为中心的调理战略,接纳流水线来掩饰延迟,或者凭证差别硬件的特征适配操作等。安排与迁徙(空间维度):KV 放在那里、怎样迁徙?该分类关注数据的存储。例如在 GPU、CPU、SSD 组成的存储层级中怎样使热门 KV 留在 GPU 显存中,或者在漫衍式或异构的盘算装备中设计迁徙战略等。体现与留存(结构维度):KV 长什么样?该分类关注数据体现。这是现在最拥挤的赛道,包括量化、驱逐等论文麋集的子领域,旨在直接镌汰 KV cache 的物理体积。
基于上述三个维度,该综述将现有事情归纳为 7 个二级种别,详细包括:以 KV 为中心的调理(KVS)、流水线与重叠(OVLP)、硬件感知的执行(HAE)、跨内存层级的 KV 编排(MHO)、跨盘算装备的 KV 编排(CDO)、KV cache 压缩(KVCC)、KV cache 留存治理(KVRM)。
该论文不但详细梳理了每个维度下的差别类型和手艺要领,还为每一类提炼了要害要点、局限与权衡,给出了可落地的适用指导。
深度洞察与开放挑战
这篇综述最有价值的部分之一,在于作者们对百余篇论文举行了全局交织剖析,从而归纳了7 大概害视察,并引发了6 大开放挑战。
首先,作者们对文献举行了跨行为共现剖析,以展现差别维度的 KV 行为之间的内在联系和协同模式;别的,作者们深入剖析了KV 行为和优化目的的作用关系,并统计了文献中对相关优化指标的现实关注情形。
基于以上两类交织剖析,作者们展现了目今领域的7 大概害视察,例如什么组合是最常见的协同模式?结构维度(如量化)虽然论文最多,为什么往往沦为系统中的「孤岛」?
基于要害视察,作者们进一步提炼了6 大开放挑战,例如在追求效率的同时,我们虽然常;峁刈⒌蕉云渲柿康挠跋,可是否往往忽视了可信度(trustworthiness)的隐形崩塌?该综述中对每一个视察和挑战都给出了详细的剖析和思绪,期待能引发社区向着越发高效与可信的 LLM 效劳系统的一连探索!
资源分享:Awesome-KV-Cache-Optimization 资源库
为了利便社区追踪这一飞速生长的领域的最新希望,论文作者同步维护了一个 Awesome 气概的资源库,收录并一连更新 sKis 领域的最新论文和代码实现。希望这个资源库能让你少走弯路!
地点:https://github.com/jjiantong/Awesome-KV-Cache-Optimization
若是你正在做 LLM Infra、模子压缩或者高性能盘算等相关偏向,接待在 GitHub 上 star 支持,或者来客栈一起补全与更新!
《美女裸身 挤奶》,《Q8X2R7L1T4J5M9B6W3》欧美大吊
“欧美性爱自拍视频”
亚洲欧美另类久久久精品小说
……
01月20日
“囯外做受 高潮网站”白鹿纯白千金风
↓↓↓
01月20日,香港马拉松将于21日举行 7.4万名跑手参与赛事,狠狠色狠狠色综合久久伊人拫,国产乱╳╳Av绿冒,抖音九条南无顶级符文最新版下载,另类 欧美
01月20日,杭衢铁路全线架梁完成,亚洲综合色图区,靠逼视频软件下载,二次元小黃片秘 网站元神,久久久久久久久久久久网
01月20日,福建各级法院保护残疾人合法权益 持续加大司法救助力度,欧美性爱一级影片,神木丽戴眼镜辅导学生,免费高清性色毛片A片,gay片网站下载
01月20日|民进中央2024年参政议政年会在武汉开幕|中文字幕高清不卡超碰|亚洲色欲综合精品无码|69xxxxxxxx|欧美久久污视频
01月20日|香港首个“全民阅读日”启动|教练撕掉胸罩揉吮奶头视频|免费一级毛片在线视频播放|芙宁娜被丘丘繁衍后代|天堂网av社区
01月20日|重庆12月起全面实施水资源费改税试点 普通居民生活用水不受影响|亚洲一级黄色无码视频|偷拍美女乳房|欧美大片天天爽|扒开美女 狂揉 歪歪视频……
01月20日,国家安全机关坚决反对“台独”分裂行径和外部势力干涉,国产欧美 第一页,三级三级三级A级全黄公司的,日本免费网址两性,扒开❌狂揉❌喷水作文
01月20日,广州琶洲港澳客运口岸累计发送旅客超13万人次,黄色片,日本网址在线观看,久在线视频精品,色哟哟哟高清在线观看
01月20日|国家通用盲文版国歌等语言文字规范发布|在线国内自拍|www.色色色网站|日韩人妻无码专区久久|2级黄色视频
01月20日,我科学家克隆出抗大豆锈病基因,欧美 日韩 91 一区,操人人91,青春草AV,国产欧美另类专区在线
01月20日,第八届全国科技馆辅导员大赛全国总决赛举办 50个项目获一等奖,国产在线播放你懂得,福利一区二区福利在线观看,小月工艺美化v12美女,玖玖精品时尚视频
01月20日,满意的理发师离职了 卡能退吗?,欧美性爱大片第一页,斩神红缨h乳欲伦岳小说,Free 国产天美MAX,在线免费观看黄色片视频网站
01月20日|国台办:民进党当局妄想给正义行动“划线设禁”是不自量力|女生裸自慰网站|欧美视频在线一区二区|91无码专区WWW|缘分的天空动漫免费观看策驰
01月20日|讲好广袤大地上的中国故事(人民论坛)|性欧俄2一区二区三区黄色网站|国产美女全身裸体无遮挡|8 8 海外华人永久免费|国产AV一区二区三区
01月20日|日本地震死亡人数升至221人 超万户房屋受损|350234去看吧孩子|午夜少妇性夜影院|国产免费av网址|春野樱全彩h同人本子免费
北方多地本周最高温或超30度,程心程意|新疆泽普:“旅游+”助推文旅产业高质量发展|A一级欧美性交|欧美狂操|:丰满熟女一级黄色视频一区二区三区|wwwww.日本
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
“假日经济”持续升温 小城市撬动文旅“大市场”
看图学习丨彰显新时代中国力量、中国精神、中国形象 总书记为他们点赞
“莎头组合”获胜!王楚钦/孙颖莎奥运后混双首秀战胜中国香港组合
两岸企业家长沙共探科技赋能文旅文创产业融合发展
山西·太谷第二十一届科技节启幕 签约15个项目
“奥运滑板少女”的新“曦”望:参加更多高水平比赛提升自己
学习进行时丨习近平主席与法国的故事
外媒:伊拉克宣布召回驻伊朗大使
巴西副总统阿尔克明:巴中经贸合作涌现新机遇
红海一希腊货船被也门胡塞武装导弹击中
欧美在线视频性爱日本
高清黄色片一级特无码
亚洲A片不卡aV在线播放
男男色色网站
在线人成免费视频
911精品国产手机在线
h视频一级免费
人人弄
另类屎尿恋物视频在线观看
女人被舔荫蒂囗交视频

闽公网安备 35010302000113号