首页
随着 LLM 向 1M 上下文演进,KV cache(键值缓存)已成为制约推理效劳效率的焦点瓶颈。自回归天生的特征使得模子必需存储历史 token 的 key-value 状态(即 KV cache)以阻止重复盘算,但 KV cache 的显存占用随着上下文长度的增添而膨胀,带来显著的内存瓶颈。
已往两年,关于 KV cache 的优化事情爆炸式增添,包括调理、迁徙、压缩等战略层出不穷。然而,现有综述主要聚焦于 LLM 推理或效劳的整体效率,大多仅将 KV cache 作为其中一个子?樽骷蛞致。
近期,来自墨尔本大学和华中科技大学的研究者们宣布了一篇深度综述,从MLSys 的头脑出发,用一套新颖的「时间 - 空间 - 结构」系统行为视角对 KV cache 优化要领举行了系统性梳理与深入剖析,并将相关资源整理成了一连维护的 Awesome 资源库,利便研究者与从业职员快速定位与落地。
论文地点: https://doi.org/10.36227/techrxiv.176046306.66521015/v3项目地点: https://github.com/jjiantong/Awesome-KV-Cache-Optimization
什么是「 sKis」?
为了提供更聚焦的视角和明确,作者们首先在综述中界说了sKis的界线:在推理效劳阶段,以 KV cache 为焦点优化工具,在不依赖模子重训或结构修改的条件下,提升吞吐、延迟等焦点系统指标。
从「系统行为」看 KV Cache
聚焦于 sKis,该综述立异性地提出以系统行为的视角来组织 KV cache 优化手艺:不是按详细流程、框架、算法来划分,而是按优化战略在系统中爆发的时间、空间、结构三个维度的行为来划分,从而更容易对齐工程实现与组合战略。
执行与调理(时间维度):KV 什么时间被会见和盘算?该分类关注执行历程与调理。例如设计以 KV 为中心的调理战略,接纳流水线来掩饰延迟,或者凭证差别硬件的特征适配操作等。安排与迁徙(空间维度):KV 放在那里、怎样迁徙?该分类关注数据的存储。例如在 GPU、CPU、SSD 组成的存储层级中怎样使热门 KV 留在 GPU 显存中,或者在漫衍式或异构的盘算装备中设计迁徙战略等。体现与留存(结构维度):KV 长什么样?该分类关注数据体现。这是现在最拥挤的赛道,包括量化、驱逐等论文麋集的子领域,旨在直接镌汰 KV cache 的物理体积。
基于上述三个维度,该综述将现有事情归纳为 7 个二级种别,详细包括:以 KV 为中心的调理(KVS)、流水线与重叠(OVLP)、硬件感知的执行(HAE)、跨内存层级的 KV 编排(MHO)、跨盘算装备的 KV 编排(CDO)、KV cache 压缩(KVCC)、KV cache 留存治理(KVRM)。
该论文不但详细梳理了每个维度下的差别类型和手艺要领,还为每一类提炼了要害要点、局限与权衡,给出了可落地的适用指导。
深度洞察与开放挑战
这篇综述最有价值的部分之一,在于作者们对百余篇论文举行了全局交织剖析,从而归纳了7 大概害视察,并引发了6 大开放挑战。
首先,作者们对文献举行了跨行为共现剖析,以展现差别维度的 KV 行为之间的内在联系和协同模式;别的,作者们深入剖析了KV 行为和优化目的的作用关系,并统计了文献中对相关优化指标的现实关注情形。
基于以上两类交织剖析,作者们展现了目今领域的7 大概害视察,例如什么组合是最常见的协同模式?结构维度(如量化)虽然论文最多,为什么往往沦为系统中的「孤岛」?
基于要害视察,作者们进一步提炼了6 大开放挑战,例如在追求效率的同时,我们虽然常;峁刈⒌蕉云渲柿康挠跋,可是否往往忽视了可信度(trustworthiness)的隐形崩塌?该综述中对每一个视察和挑战都给出了详细的剖析和思绪,期待能引发社区向着越发高效与可信的 LLM 效劳系统的一连探索!
资源分享:Awesome-KV-Cache-Optimization 资源库
为了利便社区追踪这一飞速生长的领域的最新希望,论文作者同步维护了一个 Awesome 气概的资源库,收录并一连更新 sKis 领域的最新论文和代码实现。希望这个资源库能让你少走弯路!
地点:https://github.com/jjiantong/Awesome-KV-Cache-Optimization
若是你正在做 LLM Infra、模子压缩或者高性能盘算等相关偏向,接待在 GitHub 上 star 支持,或者来客栈一起补全与更新!
《搜索儿媳-污鱼社》,《Q8X2R7L1T4J5M9B6W3》国产精选黄片
“操人摸操人操”
海贼王h娜美罗宾被x出高潮
……
01月17日
“国产极品两年半一起草”女子10米跳台跳水决赛
↓↓↓
01月17日,美国纽约一变压器突发爆炸起火 导致铁路停运 ,一级黄色录像蛊一区二区三区,看色色色色色色色色色色色色色色色黄片,欧美777777精品视频,久久越南色
01月17日,广东建立“法院+妇联”家庭教育指导新机制,一级做a爱片久久毛片A片照片,手机黄色视频网页,成年人免费黄色网站,色色影院免费
01月17日,兰石“智”造何以站稳国际市场?,色在线视频网站,厕拍大屁股青娱乐,久久国产精品免费热,超碰在线字幕
01月17日|安徽黄山税惠赋能 徽派民宿走出“国际范”|国产精品操操操|yy6080论理|欧美极品aⅴ影院天天视频|免费的va欧美视频
01月17日|美国当选总统特朗普提名国务卿等多个重要职位人选|动漫人物做羞羞网站|在线观看黄片儿。|一级片免费黄色网站|人人操人人揉人人摸
01月17日|中新健康丨蓝皮书:“十四五”以来,各地健康指标得到有效提升|日韩操逼毛片|国产精品久久久久久影视精品无码|色哟哟在线精品入口视频|国产91在线最新永久地址……
01月17日,天津法院2023年审理执行各类涉京冀案件2.98万余件,欧美性交乱伦视频,小 伸进 樱花,黄色中文字幕在线,邪恶口工强奸
01月17日,融通旅发集团推出“缘月”“福月”中秋礼盒 为市场添红为传统增色,又大又粗性av无码天堂免费,在线免费黄片大全,一级AAAAA黄片一级AAAA视频一级AAAA毛片免费看一级AAAA,你懂的视频在线看
01月17日|两会大家谈 |老外“催更”,中国故事如何“乘风破浪”|A级在线现免费观|女人十八国产精品毛片|蕾丝视频满i8进入i3秒入7y7y|免费的黄色网站在线看
01月17日,哈萨克斯坦教育部:将为170万名学生提供免费营养餐,肉乳无码A片av,亚洲黄色网免费,女人疯狂 喷水自慰爽震动器,我去オナニー了视频
01月17日,重庆连续三天发布高温红色预警信号,性插免费视频,黄色三级毛片多人,猎奇小屋(破解版),体育生爽擼又大又粗的雞巴电影
01月17日,加拿大卑诗省一直升机坠毁 已致3死4重伤,国产亚洲无线码一区二区,131美女爱做视频午夜电影,色色色色色色色色色网址,吃瓜网站166su吃瓜
01月17日|新农人扎根“中国青蟹之乡” 直播变农活带富一方百姓|把日出女人白浆免费视频|tiktok|国产婷婷色一区在线观看|黄片黄片黄片黄片黄片
01月17日|哈尔滨冰雪大世界:一键扫码可获取防寒用品分布 大滑梯排队区设暖棚|国产色无码砖区在线看|国产羞辱调教无码的视频在线播放91|永久黄色视频|喝春药做爱视频韩剧大全
01月17日|辽宁葫芦岛市绥中县卜城线干道被打通|91av福利在线观看|挤奶+玩弄 跪趴 嗯啊|欧美午夜大片性视频|无码综合网
老牌社交平台人人网停止服务,斗鱼CEO陈少杰已取保候审|【东西问·汉学家】里卡多·波佐:儒学有助全球可持续发展|馃崙91|骇爪全身漫画免费正版下载|waswasxaxkino翻译|亚洲性爱中文字幕视频
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
单课时50元 北京年轻人爱上夜校
政要遭袭,专家遇刺,伊朗为何暗杀频发?
(两会速递)中山大学今年将在香港设立高等研究院
中方敦促美方慎之又慎处理涉台问题 停止美台官方往来
【新春纪事】山东菏泽:年夜饭预订火爆 “龙元素”菜品受热捧
第二届两岸青少年“创未来”科普夏令营在福州开营
中国正能量|万里征程,他们为什么出发?
两部门:推动中试软硬件补短板、锻长板 解决堵点卡点断点问题
海关总署推进“四下基层”常态化长效化
广州荔湾举行原创作品展演
4444在线视频
激情小毛片
高清无码在线观看不卡
91a不卡中文
91精品 在线播放
白丝jK爆乳 羞羞漫画
ⅩXXX18日本老师护士HD
欧美日韩一级在线观看
在线AA亚洲视频
国产在线不卡播放

闽公网安备 35010302000113号