首页
随着 LLM 向 1M 上下文演进,KV cache(键值缓存)已成为制约推理效劳效率的焦点瓶颈。自回归天生的特征使得模子必需存储历史 token 的 key-value 状态(即 KV cache)以阻止重复盘算,但 KV cache 的显存占用随着上下文长度的增添而膨胀,带来显著的内存瓶颈。
已往两年,关于 KV cache 的优化事情爆炸式增添,包括调理、迁徙、压缩等战略层出不穷。然而,现有综述主要聚焦于 LLM 推理或效劳的整体效率,大多仅将 KV cache 作为其中一个子?樽骷蛞致。
近期,来自墨尔本大学和华中科技大学的研究者们宣布了一篇深度综述,从MLSys 的头脑出发,用一套新颖的「时间 - 空间 - 结构」系统行为视角对 KV cache 优化要领举行了系统性梳理与深入剖析,并将相关资源整理成了一连维护的 Awesome 资源库,利便研究者与从业职员快速定位与落地。
论文地点: https://doi.org/10.36227/techrxiv.176046306.66521015/v3项目地点: https://github.com/jjiantong/Awesome-KV-Cache-Optimization
什么是「 sKis」?
为了提供更聚焦的视角和明确,作者们首先在综述中界说了sKis的界线:在推理效劳阶段,以 KV cache 为焦点优化工具,在不依赖模子重训或结构修改的条件下,提升吞吐、延迟等焦点系统指标。
从「系统行为」看 KV Cache
聚焦于 sKis,该综述立异性地提出以系统行为的视角来组织 KV cache 优化手艺:不是按详细流程、框架、算法来划分,而是按优化战略在系统中爆发的时间、空间、结构三个维度的行为来划分,从而更容易对齐工程实现与组合战略。
执行与调理(时间维度):KV 什么时间被会见和盘算?该分类关注执行历程与调理。例如设计以 KV 为中心的调理战略,接纳流水线来掩饰延迟,或者凭证差别硬件的特征适配操作等。安排与迁徙(空间维度):KV 放在那里、怎样迁徙?该分类关注数据的存储。例如在 GPU、CPU、SSD 组成的存储层级中怎样使热门 KV 留在 GPU 显存中,或者在漫衍式或异构的盘算装备中设计迁徙战略等。体现与留存(结构维度):KV 长什么样?该分类关注数据体现。这是现在最拥挤的赛道,包括量化、驱逐等论文麋集的子领域,旨在直接镌汰 KV cache 的物理体积。
基于上述三个维度,该综述将现有事情归纳为 7 个二级种别,详细包括:以 KV 为中心的调理(KVS)、流水线与重叠(OVLP)、硬件感知的执行(HAE)、跨内存层级的 KV 编排(MHO)、跨盘算装备的 KV 编排(CDO)、KV cache 压缩(KVCC)、KV cache 留存治理(KVRM)。
该论文不但详细梳理了每个维度下的差别类型和手艺要领,还为每一类提炼了要害要点、局限与权衡,给出了可落地的适用指导。
深度洞察与开放挑战
这篇综述最有价值的部分之一,在于作者们对百余篇论文举行了全局交织剖析,从而归纳了7 大概害视察,并引发了6 大开放挑战。
首先,作者们对文献举行了跨行为共现剖析,以展现差别维度的 KV 行为之间的内在联系和协同模式;别的,作者们深入剖析了KV 行为和优化目的的作用关系,并统计了文献中对相关优化指标的现实关注情形。
基于以上两类交织剖析,作者们展现了目今领域的7 大概害视察,例如什么组合是最常见的协同模式?结构维度(如量化)虽然论文最多,为什么往往沦为系统中的「孤岛」?
基于要害视察,作者们进一步提炼了6 大开放挑战,例如在追求效率的同时,我们虽然常;峁刈⒌蕉云渲柿康挠跋,可是否往往忽视了可信度(trustworthiness)的隐形崩塌?该综述中对每一个视察和挑战都给出了详细的剖析和思绪,期待能引发社区向着越发高效与可信的 LLM 效劳系统的一连探索!
资源分享:Awesome-KV-Cache-Optimization 资源库
为了利便社区追踪这一飞速生长的领域的最新希望,论文作者同步维护了一个 Awesome 气概的资源库,收录并一连更新 sKis 领域的最新论文和代码实现。希望这个资源库能让你少走弯路!
地点:https://github.com/jjiantong/Awesome-KV-Cache-Optimization
若是你正在做 LLM Infra、模子压缩或者高性能盘算等相关偏向,接待在 GitHub 上 star 支持,或者来客栈一起补全与更新!
《乱美女免费视频》,《Q8X2R7L1T4J5M9B6W3》精品人妻人澡
“亚洲性爱短视频”
91在线国内在线永久播放
……
01月19日
“网红鹿少女精彩剧情演绎视频”我知道我爱你
↓↓↓
01月19日,“摆架子”脱离群众 官僚主义要根除,久久久久久久岛国免费播放,琪琪偷拍视频网,18黄色欧美午夜区一区二区三,欧美aaaaaaaa
01月19日,台风“桃芝”开始减弱 将趋向粤西到海南岛东部海面,亚洲网址在线,app-va.tiktokv.com,欧美乱自拍视频在线视频,在线播放国产不卡无毒视频
01月19日,时政微观察丨从四次座谈会读懂“一张蓝图绘到底”,日韩 欧美中文字幕,韩国顶级绝伦,国产羞羞一区免费看,伊万卡被扒开双腿猛烈进入
01月19日|海外网评:中马迎来更加辉煌的下一个50年|xxnx16|99cao|欧亚猛少妇✘✘✘✘猛叫|呦呦免费
01月19日|浙江庆元乡贤“归巢”助发展 秀珍菇撑起“致富伞”|99热国产这里只有精品久久|国产 欧美 综合 黄色电影网址精品一区|超碰中文字幕最近更新|压身肏妇xxx流
01月19日|2024香港电脑通讯节开幕|被主人调教边c边打屁股桃子微博|成人福利网站导航秘 涩涩屋|妲己❌爆乳❌妲己自慰日本|黑太星野鱼哥在线观看高清……
01月19日,台湾青年筑梦福建福鼎乡村:心中有梦,眼里有光,视频丨9l 丨乱辈,vr免费人成视频免费看片,免费黄网址,亚洲中文字幕第一页精品
01月19日,中新网拟换发第七版新闻记者证人员名单公示,先锋资源国产,超碰在线只有精品,欧美视频,日韩视频,男女被c 黄秘 网站
01月19日|飞虫为何扑灯?国际最新研究称灯光或会破坏昆虫准确定位能力|国产精选A片网站|9.1免费网站nba在线观看下载|黄网站在线视频免费无码|夹完腿为什么一跳一跳的会宫缩吗
01月19日,(经济观察)综合科技创新水平指数西部第一,重庆是如何炼成的?,黄在线网址,看个毛片,🈲🈲母狗淫水,在线永久免费观看黄网站
01月19日,“3820”战略工程启示:“以人民为中心”贯穿这一战略工程始终,免费日本黄色网址,深夜色色色,福利精品一区,宵宫爆乳18
01月19日,外媒:以色列袭击黎巴嫩南部致3人遇难,美女脱光无马赛克,里番本子acg次元,全彩全彩无遮邪恶本女子,全球最大色情网站
01月19日|头茬西瓜!江苏沛县3万多亩西瓜甜蜜上市|在线加勒比无码专区|秘密入口专属官网发布页|妺妺坐在我腿上流白浆|http://www.qukanpian.com
01月19日|中外专家热议新质生产力:人工智能提供关键驱动力|成年女人免费毛片|AA黄网视频|成年人国产福利网站|欧美囯产一区二区激情无套
01月19日|北京大中小学校2025年普遍开展人工智能场景应用|404黄色网站点击进入|女帝被 到爽 高潮痉挛漫画|欧洲性爱高清无码|欧美丰满熟妇xxxx性
漩涡,胡可晒安吉近照|(新春走基层)乡土专家和他的一把果树剪刀|亚洲欧美日韩性交一区视频观看|主人在调教室性调教女仆游|一本大道香蕉青青久久|精品国产一级性黄片
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
第二届环西自行车中国挑战赛·北京昌平将于今年5月开赛
博物馆火了,然后呢?
读懂夜校走红背后的文化需求
浙江“获得电力”指标达世界银行最优标准
湖南大力推进智能制造 赋能制造业高质量发展
我们的姿态自信开放——从“千年瓷都”看文化传承发展
习言道|习近平这样谈青年担当
“宝总”胡歌的宝岛情:繁花似锦,不虚此行
台湾花莲县海域发生5.3级地震 震源深度20千米
冰雪赛事全民同乐——“十四冬”群众比赛开赛
打光屁股撅臀调教sp
国产男女激情视频免费播放
在线观看黄中文字幕
国产精品久久国产,国产精品久久国产精,国产精品久久国产精品
94人人操人人操
美女裸脏长什么样
青久的视频国产
欧美两性黑大粗在线观看
把麻麻肚子摘大了的小说
九产九精九国九品

闽公网安备 35010302000113号