首页
新智元报道
编辑:LRST
【新智元导读】DeepSeek-OCR的视觉文本压缩(VTC)手艺通过将文本编码为视觉Token,实现高达10倍的压缩率,大幅降低大模子处置惩罚长文本的本钱。可是,视觉语言模子能否明确压缩后的高密度信息?中科院自动化所等推出VTCBench基准测试,评估模子在视觉空间中的认知极限,包括信息检索、关联推理和恒久影象三大使命。
近期,DeepSeek-OCR依附其立异的「视觉文本压缩」(Vision-Text Compression, VTC)范式引发了手艺圈的高度关注,以少少的视觉Token实现高效的文本信息编码,为长文本处置惩罚开发了新路径。
这一突破性希望让大模子处置惩罚超长文档的本钱大幅降低,但也抛出了一个焦点问题:当长文本被高度压缩为2D图像后,视觉语言模子(VLM)真的能明确其中的内容吗?
为相识答这一疑问,来自中科院自动化所、中国科学院香港立异研究院等机构的研究团队推出了首个专门针对视觉-文本压缩范式的基准测试——VTCBench。
论文链接:https://arxiv.org/abs/2512.15649
VTCBench链接: https://github.com/Moenupa/VTCBench
VLMEvalKit链接:https://github.com/bjzhb666/VLMEvalKit
Huggingface链接: https://huggingface.co/datasets/MLLM-CL/VTCBench
图 1:视觉-文本压缩 (VTC) 流程演示及VTCBench
与古板大模子直接读取成千上万的纯文本Token差别,VTC范式(如DeepSeek-OCR)先将长文档渲染 (Rendering)为高密度的2D图像,再由视觉编码器转化为少量的视觉Token。
该手艺可实现2倍至10倍的Token压缩率,显著降低了长文本处置惩罚时的盘算与显存开销。
VTCBench现已在GitHub和Huggingface周全开源,其衍生版本VTCBench-Wild是一个统一的、全方位评估模子在重大现实场景下视觉文本压缩的鲁棒性,现已集成到VLMevalkit。
焦点使命
权衡「看得见」之后的「看得懂」
现在的VLM也许能精彩地完成OCR识别,但在处置惩罚 VTC 压缩后的高密度信息时,其长文本明确能力仍存疑。
VTCBench通过三大使命,系统性地评估模子在视觉空间中的认知极限:
1.VTC-Retrieval (信息检索):在视觉「大海」中寻找特定事实的「针」(Needle-in-a-Haystack),测试模子对空间漫衍信息的捕获能力。
2.VTC-Reasoning (关联推理):挑战模子在险些没有文本重叠的情形下,通过关联推理寻找事实,逾越纯粹的词汇检索。
3.VTC-Memory (恒久影象):模拟超长对话,评估模子在视觉压缩框架下,抵御时间与结构性信息衰减的能力。
别的,团队同步推出了VTCBench-Wild,引入 99 种差别的渲染设置(涵盖多种字体、字号、行高及配景),全方位检测模子在重大现实场景下的鲁棒性。
揭秘视觉压缩背后的认知瓶颈
图 2:VTCBench针对模子在长图像中检索信息的热力争。横轴代表上下文长度,纵轴代表要害事实(Needle)在文档中的深度。展现了模子体现的「迷失」与突破。
测试效果泛起出显著的「U 型曲线」:与文本模子类似,视觉语言模子(VLM)能够精准捕获开头和最后的信息,但关于中心部分的事实,明确能力会随着文档变长而强烈衰退。这证实晰纵然在视觉空间,模子依然保存严重的「空间注重力私见」,是未来 VTC 架构优化的要害偏向。
行业洞察
视觉压缩是长文本的终局吗?
通过对GPT、Gemini、Claude、QwenVL、InternVL、Gemma、KimiVL、Seed1.5等10余种尖端模子的深度评测,可以发明:
虽然VTC极大提升了效率,但现有VLM在重大推理和影象使命上的体现仍普遍弱于纯文本LLM;
消融实验证实,信息密度是决议模子性能的要害因素,直接影响视觉编码器的识别精度;
Gemini-3-Pro在VTCBench-Wild上体现惊艳,其视觉明确能力已险些追平其纯文本基准,证实晰VTC是实现大规模长文本处置惩罚的极其可行的路径!
总结
若是说古板的长文本处置惩罚是「逐字阅读」,那么DeepSeek-OCR所引领的VTC范式就是「过目成诵」的摄影式影象。VTCBench的泛起,正是为了确保模子在拥有这种「超能力」的同时,依然能够读懂字里行间的微言大义。
参考资料:
https://arxiv.org/abs/2512.15649
秒追ASI
?点赞、转发、在看一键三连?
点亮星标,锁定新智元极速推送!
《久99热》,《Q8X2R7L1T4J5M9B6W3》偶像女友堕落NTR》
“哈尔滨60岁丰满熟女高潮露脸”
欧美性色aⅴ视频一区日韩精品
……
01月09日
“中文字幕无线在线视频”《九龙城寨之围城》豆瓣开分7.5
↓↓↓
01月09日,俄媒:俄军完全控制奥切列蒂诺 摧毁一辆美制坦克,17c馃埐,一本到高清无码不卡,人妻猎人韩漫未删减版,aiai 在线视频
01月09日,展柜内文物发霉?博物馆别成文保盲区,a片操屄视频,日韩在线你懂得,免费观看高清A级毛片,日本久久网站
01月09日,嫦娥六号搭载法国科学载荷升空 中法首次携手探月,www.黄片免费,污污污18禁网站在线永久免费看,激情免费黄色视频,一级黄色毛片网站多少
01月09日|西藏拉萨:民众起舞迎春|国产精品福利一|崩坏星穹铁道银狼x开拓者|成人动画 羞羞在线观看|亚洲欧美日韩国产另类精品
01月09日|“第二十条”被唤醒!法律专家谈如何正当防卫|www.jswanteng.com|嗯轻点啊啊不要|欧美一区亚洲一区|自慰潮喷无遮挡全过程在线观看。
01月09日|第四届“香港潮州节”将于11月20日至24日举行|插女人阴道的视频|国产精品国色综合久久|日日操97|a片乱伦视频网址……
01月09日,森林、草原、河流、湖泊……这些自然资源有“户口本”了,产自拍偷拍视频91,免费看 裸体视频,午夜精品久久久久久午夜福利视屏,女人下面毛多日起太爽
01月09日,贵州汇川:护林员陈正华“以林为家”坚守林场25年,在线看黄色的网站,超碰123,三级片国产网站,欧美激情 三区
01月09日|2024年黑龙江省“北疆·石榴情”各族青少年主题交流活动启动|吴姐全家互换共乐的读后感450字|色哥导航四区|军人大雕|黄片骚片毛片免费看
01月09日,东西问丨包亚明:电视剧《繁花》“港风”绽放,沪港双城如何“双星辉映”?,小12学生洗澡裸体视频网站,国产狼友精品网站,禁漫天堂破解版,国产一级婬片A片免费丝袜
01月09日,麦当劳中国科研总部落户江苏南京,色网自拍,欧美性爱ⅩXX,色阁二,狠狠色2019
01月09日,8千名跑友畅跑重庆涪陵白鹤梁半程马拉松,视频3区在线,体育生骚0被猛男顶到射精,国内精品一级无码免费播放费,免费无码国产
01月09日|德国小学生在柏林中国文化中心体验春节文化|久草三级视频在线|国内在线精品一区二区AV|免费黄a视频|99精品视频网址
01月09日|首届中国泉州丝路小吃节掀起古城“味蕾风暴”|玄兵大战倾辛2024免费观看|AV黄片免费在线|黄片 黄片 黄片|捆绑 调教 sm 束缚男动态图
01月09日|内蒙古首家民营稀土新材料企业在深圳上市|张雨绮裸体被 羞羞网站|最新激情视频网站|欧美性大交|欧美亚洲国产91
习近平总书记出席2024全国两会纪实,凶劫601航班|巴基斯坦媒体人走进新疆伊犁|久久精品国产亚洲AV无码娇|狼友欧美日韩三级|www.69视频|免费乱理伦片在线观看中文
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
重庆武隆高山腊肉节邀游客吃刨猪宴 现场拍卖608斤“猪王”
(新春走基层)探访长沙首个完整社区:全龄友好 惠民便民
中新健康丨从塞内加尔归来的援外医生:为白内障患者带去“光明”
学习领会习近平总书记对政法工作的重要指示
考古题材纪录片:讲述中华文明的精彩故事
深圳深江铁路施工现场发生坍塌 13名现场作业人员失联
深圳持续治理电动自行车安全隐患
北京力争到2027年新型储能产业营收超千亿元
港人共享祖国发展成果 渐渐融入湾区生活圈
婺州窑传承人陈新华:欣慰更多人将假期“分给”瓷器
九一精品欧美综合视频
97资源站超碰
黄色国产av
国产欧美曰韩综合网另类
美女的裙底秘 免费观看
【乱子伦】国产精品
一级欧洲免费视频在线观看
学生XXXXX视频
中文字幕免费在线看
欧美一级A片免费一级A片

闽公网安备 35010302000113号