首页
随着 LLM 向 1M 上下文演进,KV cache(键值缓存)已成为制约推理效劳效率的焦点瓶颈。自回归天生的特征使得模子必需存储历史 token 的 key-value 状态(即 KV cache)以阻止重复盘算,但 KV cache 的显存占用随着上下文长度的增添而膨胀,带来显著的内存瓶颈。
已往两年,关于 KV cache 的优化事情爆炸式增添,包括调理、迁徙、压缩等战略层出不穷。然而,现有综述主要聚焦于 LLM 推理或效劳的整体效率,大多仅将 KV cache 作为其中一个子?樽骷蛞致。
近期,来自墨尔本大学和华中科技大学的研究者们宣布了一篇深度综述,从MLSys 的头脑出发,用一套新颖的「时间 - 空间 - 结构」系统行为视角对 KV cache 优化要领举行了系统性梳理与深入剖析,并将相关资源整理成了一连维护的 Awesome 资源库,利便研究者与从业职员快速定位与落地。
论文地点: https://doi.org/10.36227/techrxiv.176046306.66521015/v3项目地点: https://github.com/jjiantong/Awesome-KV-Cache-Optimization
什么是「 sKis」?
为了提供更聚焦的视角和明确,作者们首先在综述中界说了sKis的界线:在推理效劳阶段,以 KV cache 为焦点优化工具,在不依赖模子重训或结构修改的条件下,提升吞吐、延迟等焦点系统指标。
从「系统行为」看 KV Cache
聚焦于 sKis,该综述立异性地提出以系统行为的视角来组织 KV cache 优化手艺:不是按详细流程、框架、算法来划分,而是按优化战略在系统中爆发的时间、空间、结构三个维度的行为来划分,从而更容易对齐工程实现与组合战略。
执行与调理(时间维度):KV 什么时间被会见和盘算?该分类关注执行历程与调理。例如设计以 KV 为中心的调理战略,接纳流水线来掩饰延迟,或者凭证差别硬件的特征适配操作等。安排与迁徙(空间维度):KV 放在那里、怎样迁徙?该分类关注数据的存储。例如在 GPU、CPU、SSD 组成的存储层级中怎样使热门 KV 留在 GPU 显存中,或者在漫衍式或异构的盘算装备中设计迁徙战略等。体现与留存(结构维度):KV 长什么样?该分类关注数据体现。这是现在最拥挤的赛道,包括量化、驱逐等论文麋集的子领域,旨在直接镌汰 KV cache 的物理体积。
基于上述三个维度,该综述将现有事情归纳为 7 个二级种别,详细包括:以 KV 为中心的调理(KVS)、流水线与重叠(OVLP)、硬件感知的执行(HAE)、跨内存层级的 KV 编排(MHO)、跨盘算装备的 KV 编排(CDO)、KV cache 压缩(KVCC)、KV cache 留存治理(KVRM)。
该论文不但详细梳理了每个维度下的差别类型和手艺要领,还为每一类提炼了要害要点、局限与权衡,给出了可落地的适用指导。
深度洞察与开放挑战
这篇综述最有价值的部分之一,在于作者们对百余篇论文举行了全局交织剖析,从而归纳了7 大概害视察,并引发了6 大开放挑战。
首先,作者们对文献举行了跨行为共现剖析,以展现差别维度的 KV 行为之间的内在联系和协同模式;别的,作者们深入剖析了KV 行为和优化目的的作用关系,并统计了文献中对相关优化指标的现实关注情形。
基于以上两类交织剖析,作者们展现了目今领域的7 大概害视察,例如什么组合是最常见的协同模式?结构维度(如量化)虽然论文最多,为什么往往沦为系统中的「孤岛」?
基于要害视察,作者们进一步提炼了6 大开放挑战,例如在追求效率的同时,我们虽然常;峁刈⒌蕉云渲柿康挠跋,可是否往往忽视了可信度(trustworthiness)的隐形崩塌?该综述中对每一个视察和挑战都给出了详细的剖析和思绪,期待能引发社区向着越发高效与可信的 LLM 效劳系统的一连探索!
资源分享:Awesome-KV-Cache-Optimization 资源库
为了利便社区追踪这一飞速生长的领域的最新希望,论文作者同步维护了一个 Awesome 气概的资源库,收录并一连更新 sKis 领域的最新论文和代码实现。希望这个资源库能让你少走弯路!
地点:https://github.com/jjiantong/Awesome-KV-Cache-Optimization
若是你正在做 LLM Infra、模子压缩或者高性能盘算等相关偏向,接待在 GitHub 上 star 支持,或者来客栈一起补全与更新!
《人人爽人人爱人人操》,《Q8X2R7L1T4J5M9B6W3》欧美日韩黄片免费在线观看
“欧美人操大陆”
男人🐔和女人做爱的视频
……
01月19日
“免费AAA级黄色视频”吧友神计算胡歌身高
↓↓↓
01月19日,哈尔滨中央大街国际旅游集散中心启用,一級黃色生活片,欧美一级视频免费,日本道综合一本久久久88,人人看人人插摸?
01月19日,【理响中国·青年学习班】 党纪学习教育需知行合一,AV集中淫,欧美在线观看精品一区二区,中国老头老太❌❌❌拒绝改写,荣荣的胸襟距离观察视频
01月19日,韩国国会通过“解除戒严”决议 中新社记者现场直击,女生隐私18+软件,成年人免费黄色网站,日韩人妻无码妖精视频,在看线看黄片4
01月19日|2024“天府建造节”开幕 两岸和香港师生成都同台竞技|黄色网站免费看coom|国产性交在线|古代AV|星野26号直播录屏回放黑料
01月19日|金庸诞辰100周年文化交流活动在浙江嘉兴举行|7BⅩ8CC|黄片播放|蓝莓破解版|igao狠狠操
01月19日|全国首个演艺经纪协会在浙江横店成立|Pornhub下载网址|少妇xxx|国产噜噜网站在线播放|久久精品免费A片……
01月19日,“香”遇智利 五粮液再启“和美之约”,男女18 黄网站,揉我胸 啊 嗯出水了H苏桃漫画,国产免费喷水大黄在线观看,亚欧美女野外激情视频网站
01月19日,人工智能能力建设国际合作之友小组在联合国正式成立 中方介绍情况,欢乐谷乱伦母子,扒开雏田 狂揉 3DXXXvideo,国产91在线最新永久地址,叶山小百合被部长暴打是第几集
01月19日|云南省人大环境与资源保护委员会原副主任委员杨健被查|黑暗蘑菇17C官网入口最新版下载|泡妞WWWWWⅩXXXX可可|深夜aV片在线观看网站|久久99这里只有免费精品
01月19日,23人被问责 山西公布增子坊煤矿一般机电事故调查报告,可以直接看黄色的免费网站,夜月app,PornoHD.886老婆,牝户伦乱欧美
01月19日,大陆台胞:六成民众不认可民进党 民间走亲走近是趋势,无码国产精品1区2区免费,打屁股游戏脱裤子下载,国产在线播,igao爱搞视频网
01月19日,第三批中华老字号名单公布 全国老字号数量达到1455个,亚洲最大的黄色网站视频观看,九九影院按摩视频,日韩城人视频在线观看,欧美一级精品A片
01月19日|“不会接受” :内塔尼亚胡最新表态!|久久精品视频图|啊啊啊啊好大舒服|色色色色色色色色色色色色色色色色色色|白丝 jk 乳 91动漫
01月19日|山东青岛:渔民春捕忙 螺虾丰满舱|国产一二三小姐软件下载|做运动不盖被子的视频教程|人人人插人人人干人人人操|狼友视频www中文在线观看
01月19日|珠海暴雨红色预警 多个景区闭园|干逼逼逼逼逼|日本加勒比人人看人人爱人人操|美女被操逼|www777miqi
山东花饽饽一口咬出8个金元宝,孙杨世界纪录被打破|中方:愿为防止叙利亚局势进一步恶化作出积极努力|xxnx1|女性外阴性交时按摩影视|欧美日韩 国产|火影r18h漫
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
贵州龙里:沉浸式演艺秀“贵秀”精彩上演
部长通道丨如何解决“一票难求”、入境游客便利性等问题 部长回应来了→
首届钱江源公路自行车赛收官
农业农村部:2023年粮食产量13908.2亿斤 再创历史新高
“五一”返程高峰至,多地降雨,安全出行提示→
意大利检方开始调查林奇游艇沉没案
北京东城:奥运健儿与体校师生交流
端午看房忙 中介一天带看六组
哈尔滨男子雇中巴免费接送游客往返731部队遗址
航拍“世界一绝”悬空寺:高于地面50余米 让人如临深渊
中文字幕国产综合
日韩欧美一级黄色视频
视色4Se.COm
校 被 出奶 视频
G头条Gay视频网站
国产毛A片啊久久久久久
狠狠爱狠狠操在线观看
国产免费www
99精品在线视频观看
国产一区二区久久网

闽公网安备 35010302000113号