首页
随着 LLM 向 1M 上下文演进,KV cache(键值缓存)已成为制约推理效劳效率的焦点瓶颈。自回归天生的特征使得模子必需存储历史 token 的 key-value 状态(即 KV cache)以阻止重复盘算,但 KV cache 的显存占用随着上下文长度的增添而膨胀,带来显著的内存瓶颈。
已往两年,关于 KV cache 的优化事情爆炸式增添,包括调理、迁徙、压缩等战略层出不穷。然而,现有综述主要聚焦于 LLM 推理或效劳的整体效率,大多仅将 KV cache 作为其中一个子?樽骷蛞致。
近期,来自墨尔本大学和华中科技大学的研究者们宣布了一篇深度综述,从MLSys 的头脑出发,用一套新颖的「时间 - 空间 - 结构」系统行为视角对 KV cache 优化要领举行了系统性梳理与深入剖析,并将相关资源整理成了一连维护的 Awesome 资源库,利便研究者与从业职员快速定位与落地。
论文地点: https://doi.org/10.36227/techrxiv.176046306.66521015/v3项目地点: https://github.com/jjiantong/Awesome-KV-Cache-Optimization
什么是「 sKis」?
为了提供更聚焦的视角和明确,作者们首先在综述中界说了sKis的界线:在推理效劳阶段,以 KV cache 为焦点优化工具,在不依赖模子重训或结构修改的条件下,提升吞吐、延迟等焦点系统指标。
从「系统行为」看 KV Cache
聚焦于 sKis,该综述立异性地提出以系统行为的视角来组织 KV cache 优化手艺:不是按详细流程、框架、算法来划分,而是按优化战略在系统中爆发的时间、空间、结构三个维度的行为来划分,从而更容易对齐工程实现与组合战略。
执行与调理(时间维度):KV 什么时间被会见和盘算?该分类关注执行历程与调理。例如设计以 KV 为中心的调理战略,接纳流水线来掩饰延迟,或者凭证差别硬件的特征适配操作等。安排与迁徙(空间维度):KV 放在那里、怎样迁徙?该分类关注数据的存储。例如在 GPU、CPU、SSD 组成的存储层级中怎样使热门 KV 留在 GPU 显存中,或者在漫衍式或异构的盘算装备中设计迁徙战略等。体现与留存(结构维度):KV 长什么样?该分类关注数据体现。这是现在最拥挤的赛道,包括量化、驱逐等论文麋集的子领域,旨在直接镌汰 KV cache 的物理体积。
基于上述三个维度,该综述将现有事情归纳为 7 个二级种别,详细包括:以 KV 为中心的调理(KVS)、流水线与重叠(OVLP)、硬件感知的执行(HAE)、跨内存层级的 KV 编排(MHO)、跨盘算装备的 KV 编排(CDO)、KV cache 压缩(KVCC)、KV cache 留存治理(KVRM)。
该论文不但详细梳理了每个维度下的差别类型和手艺要领,还为每一类提炼了要害要点、局限与权衡,给出了可落地的适用指导。
深度洞察与开放挑战
这篇综述最有价值的部分之一,在于作者们对百余篇论文举行了全局交织剖析,从而归纳了7 大概害视察,并引发了6 大开放挑战。
首先,作者们对文献举行了跨行为共现剖析,以展现差别维度的 KV 行为之间的内在联系和协同模式;别的,作者们深入剖析了KV 行为和优化目的的作用关系,并统计了文献中对相关优化指标的现实关注情形。
基于以上两类交织剖析,作者们展现了目今领域的7 大概害视察,例如什么组合是最常见的协同模式?结构维度(如量化)虽然论文最多,为什么往往沦为系统中的「孤岛」?
基于要害视察,作者们进一步提炼了6 大开放挑战,例如在追求效率的同时,我们虽然常;峁刈⒌蕉云渲柿康挠跋,可是否往往忽视了可信度(trustworthiness)的隐形崩塌?该综述中对每一个视察和挑战都给出了详细的剖析和思绪,期待能引发社区向着越发高效与可信的 LLM 效劳系统的一连探索!
资源分享:Awesome-KV-Cache-Optimization 资源库
为了利便社区追踪这一飞速生长的领域的最新希望,论文作者同步维护了一个 Awesome 气概的资源库,收录并一连更新 sKis 领域的最新论文和代码实现。希望这个资源库能让你少走弯路!
地点:https://github.com/jjiantong/Awesome-KV-Cache-Optimization
若是你正在做 LLM Infra、模子压缩或者高性能盘算等相关偏向,接待在 GitHub 上 star 支持,或者来客栈一起补全与更新!
《80岁老岳一晚三次》,《Q8X2R7L1T4J5M9B6W3》欧美亚洲综合视频
“女性生殖器官图小妹妹”
林书辞在线观看免费高清完整版
……
01月17日
“美女啪啪同人漫画入口网站”男童被武术教练殴打致死案一审宣判
↓↓↓
01月17日,习近平会见尼泊尔总理奥利,黄色国产一级AV,日本卡三卡四,my13777蜜芽,国产精品VA在线观看国语
01月17日,国寿寿险全面启动2024年“3·15”金融消费者权益保护教育宣传活动,在线视频免费播放黄高清,18禁无码久久精品中文字幕乱码,伊人狠狠干,巨大欧美 BVV
01月17日,8月份全国自然灾害风险形势发布:我国七大江河流域已全面进入主汛期,一级黄色视频激情,玖玖玖啪色,久久av网址,一级特黄无码久
01月17日|“中国白莲之乡”江西广昌何以打造南方珍稀食用菌产业孵化基地?|锐锐美图脚|性一级大片|伊人精品无码|白嫩极品教师自慰
01月17日|十年磨一剑的贵南高铁“线路诊疗师”|强奸妈妈在线观看|亚洲一区二区三区动图|一区二区不卡视频免费观看|中国黄色强奸视频电影看
01月17日|CEPA实施20年 探香港内地电影合作新机遇|福利社影院|中文字幕在线14页|在线免费AV在线|日人妻超碰……
01月17日,中新教育丨聚焦亲子双向成长 家庭轻喜剧《欢乐家长群》定档,欧美多人在线,超碰97最新在线,免费黄色软件下载,黄色毛片AAA视频
01月17日,福建将提升春节期间能源保障能力 全力做好向华东地区送电服务保障,66夜色精品亚洲网站换脸,青草 国产 在线,欧美性交乱伦视频,男人把
01月17日|黄埔百年丨共产党人对黄埔军校的贡献|快射视频网站入口|人人干人人草人人操|姬小满同人视频18 网站在线看|that p的结构黄色电影黄色的片子黄色片
01月17日,“新中式”旅游持续升温 “国潮”澎湃中彰显文化自信,欧美国产精品一区二区免费,欧美大肥婆一级特大AA片,黄页网站视频免费大全,国产精品久久久久电影院国语
01月17日,推动高质量发展·权威发布|广西:过去三年规模以上工业增加值年均增长6.5%,久久亚洲精品玖玖玖玖,18 成人免费网站,免费外国毛片视频,欧美日韩精品视频一区在线看
01月17日,有期徒刑三年!李佩霞受贿案一审宣判,影音先锋来5566AV资源,可以免费观看了黄色视频,久久理论视频,污色视频在线观看网站
01月17日|(新春走基层)探访重庆新建规模最大高铁站:金属屋面施工忙|国产真实迷j在线观看免费|男吃乳玩尖看视频高潮60|欧美色情综合久久久久|欧美日韩你懂的精品网站
01月17日|第75集团军某旅操舟集训乘风破浪|国产A片久久精品|俏佳人理论片|一区视频在线播放、真人黄色录像一级片|张津瑜星辰影院
01月17日|山西阳泉叫响“一城阳光 泉漾太行”品牌 推动文旅产业高质量发展|久久在线自拍|717影视午夜理论片 爱恋天下|久久精品视频55|日本精品久久久久中文字幕3
全资进组2,57岁拳王泰森将重返擂台|部分1分起投 理财产品申购门槛调整|欧美成人 高潮片无爱不欢|国产精品永久免费高清|JIZZ精品JIZZ中国JIZZ|性爱窝窝
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
中新健康丨中疾控:元旦假期后新冠疫情仍处较低水平 或在本月出现回升
超九成受访大学生感到恋爱课上收获颇丰
检察机关向行政机关提出检察建议78.4万件 回复整改率98.7%
150余家国内外机器人企业将亮相2024世界机器人大会
(两会声音)中国大洋科考首位女首席科学家:加强自主创新 助力海洋强国
艺术家写“福”送“福” 以中国传统文化“为奥运喝彩”
山西古建筑100问——一座关帝庙为什么是“万里茶道”的重要见证?
福建多项首创优化台胞数字人民币服务
建三江供电公司推进66千伏前哨变电站增容改造工程 为农场现代化发展赋能
石门沟村:60余载让“林进沙退” 欲点“沙”成金
未满十八禁入的免费黄色视频
xaxfilimwas was 2025
日韩美国产综合一区视频
亚洲一区二区三区另类小说
你懂的国产在线观看
国产 激情 91
男人露jiji秘 无内裤遮挡
精精品人妻一区二区三区
影音先锋熟女少妇资源网站
深圳有限公司天堂网精品视频

闽公网安备 35010302000113号