首页
新智元报道
编辑:LRST
【新智元导读】DeepSeek-OCR的视觉文本压缩(VTC)手艺通过将文本编码为视觉Token,实现高达10倍的压缩率,大幅降低大模子处置惩罚长文本的本钱。可是,视觉语言模子能否明确压缩后的高密度信息?中科院自动化所等推出VTCBench基准测试,评估模子在视觉空间中的认知极限,包括信息检索、关联推理和恒久影象三大使命。
近期,DeepSeek-OCR依附其立异的「视觉文本压缩」(Vision-Text Compression, VTC)范式引发了手艺圈的高度关注,以少少的视觉Token实现高效的文本信息编码,为长文本处置惩罚开发了新路径。
这一突破性希望让大模子处置惩罚超长文档的本钱大幅降低,但也抛出了一个焦点问题:当长文本被高度压缩为2D图像后,视觉语言模子(VLM)真的能明确其中的内容吗?
为相识答这一疑问,来自中科院自动化所、中国科学院香港立异研究院等机构的研究团队推出了首个专门针对视觉-文本压缩范式的基准测试——VTCBench。
论文链接:https://arxiv.org/abs/2512.15649
VTCBench链接: https://github.com/Moenupa/VTCBench
VLMEvalKit链接:https://github.com/bjzhb666/VLMEvalKit
Huggingface链接: https://huggingface.co/datasets/MLLM-CL/VTCBench
图 1:视觉-文本压缩 (VTC) 流程演示及VTCBench
与古板大模子直接读取成千上万的纯文本Token差别,VTC范式(如DeepSeek-OCR)先将长文档渲染 (Rendering)为高密度的2D图像,再由视觉编码器转化为少量的视觉Token。
该手艺可实现2倍至10倍的Token压缩率,显著降低了长文本处置惩罚时的盘算与显存开销。
VTCBench现已在GitHub和Huggingface周全开源,其衍生版本VTCBench-Wild是一个统一的、全方位评估模子在重大现实场景下视觉文本压缩的鲁棒性,现已集成到VLMevalkit。
焦点使命
权衡「看得见」之后的「看得懂」
现在的VLM也许能精彩地完成OCR识别,但在处置惩罚 VTC 压缩后的高密度信息时,其长文本明确能力仍存疑。
VTCBench通过三大使命,系统性地评估模子在视觉空间中的认知极限:
1.VTC-Retrieval (信息检索):在视觉「大海」中寻找特定事实的「针」(Needle-in-a-Haystack),测试模子对空间漫衍信息的捕获能力。
2.VTC-Reasoning (关联推理):挑战模子在险些没有文本重叠的情形下,通过关联推理寻找事实,逾越纯粹的词汇检索。
3.VTC-Memory (恒久影象):模拟超长对话,评估模子在视觉压缩框架下,抵御时间与结构性信息衰减的能力。
别的,团队同步推出了VTCBench-Wild,引入 99 种差别的渲染设置(涵盖多种字体、字号、行高及配景),全方位检测模子在重大现实场景下的鲁棒性。
揭秘视觉压缩背后的认知瓶颈
图 2:VTCBench针对模子在长图像中检索信息的热力争。横轴代表上下文长度,纵轴代表要害事实(Needle)在文档中的深度。展现了模子体现的「迷失」与突破。
测试效果泛起出显著的「U 型曲线」:与文本模子类似,视觉语言模子(VLM)能够精准捕获开头和最后的信息,但关于中心部分的事实,明确能力会随着文档变长而强烈衰退。这证实晰纵然在视觉空间,模子依然保存严重的「空间注重力私见」,是未来 VTC 架构优化的要害偏向。
行业洞察
视觉压缩是长文本的终局吗?
通过对GPT、Gemini、Claude、QwenVL、InternVL、Gemma、KimiVL、Seed1.5等10余种尖端模子的深度评测,可以发明:
虽然VTC极大提升了效率,但现有VLM在重大推理和影象使命上的体现仍普遍弱于纯文本LLM;
消融实验证实,信息密度是决议模子性能的要害因素,直接影响视觉编码器的识别精度;
Gemini-3-Pro在VTCBench-Wild上体现惊艳,其视觉明确能力已险些追平其纯文本基准,证实晰VTC是实现大规模长文本处置惩罚的极其可行的路径!
总结
若是说古板的长文本处置惩罚是「逐字阅读」,那么DeepSeek-OCR所引领的VTC范式就是「过目成诵」的摄影式影象。VTCBench的泛起,正是为了确保模子在拥有这种「超能力」的同时,依然能够读懂字里行间的微言大义。
参考资料:
https://arxiv.org/abs/2512.15649
秒追ASI
?点赞、转发、在看一键三连?
点亮星标,锁定新智元极速推送!
《第七色色色》,《Q8X2R7L1T4J5M9B6W3》知名国产欧美激情在线播放
“亚洲日韩Av无码中文字幕美国,日韩精品无码一级A片,日韩A片无码毛片免费看,亚”
美女高潮被男人桶出水免费视频
……
01月11日
“永久无码日韩A片免费看”南北方小年日期为什么不一样
↓↓↓
01月11日,促进文明交流互鉴 推动实现世界和平,亚洲无码论谈,痴梦少女3,国产精品视频导航,欧美禁片网站
01月11日,广西梧州璀璨夜景迎客来 百年骑楼城人山人海,欧美狂野激情XXXX,日逼视频应用,免费的日韩av大全,https://kvx1o066.top/
01月11日,水天相映 看哈素海的天空之镜美景,裸体视频se,G0G0大胆无码免费人体视频,黄色视频连接在线,A级黄色性爱视频
01月11日|冲击世界杯之路延续 国足命运还在“自己脚下”|黄瓜视频搞黄免费下载观看|欧美性爱偷拍|小萝w社w少w妇w入口视频众乐乐|国产谣色
01月11日|东西问|徐少华:武王墩墓与楚文化有何渊源?|欧美大胸美女自慰到喷水|一级AV免费电影片|国产一级免费啪啪|免费看欧美爱爱太爽了A片
01月11日|“山水工程”促进生态治理体系一体化发展|欧美日韩国产无线码一区|www.99.riav|综合图区另类图区卡通动漫|91视频久久久久久久精品……
01月11日,大湾区海上互联互通提速 海事部门打出安全保障“组合拳”,Metαrt裸美女,A啊片在线观看,av在线导航无码,女警察被五化大绑性交
01月11日,广东省揭阳市1名干部被查,高清乱码免费照片,亚洲熟女国产一区二区三区,AAAA美国黄色小视频我看看,一级a片在线观看
01月11日|AI眼中的中国|腊月二十三,糖瓜粘|千仞雪 开腿让我爽了小说|打开B站看片|亚瑟二月偷拍服装女模特拉屎网站|狠狠色综合网站
01月11日,2024中国民营企业投融资洽谈会在天津开幕,av在线最新,九九视频这里有精品,色亚洲 乱 换,欧美一级A片欧美视频
01月11日,肯尼亚政府顾问驳斥“债务陷阱论”:建议他们“多做功课”丨世界观,美女裸体黄网站18禁止免费下载,欧美一区精品中文字幕综合看片,卡一卡二卡三播放,你懂的亚洲综合在线视频
01月11日,大批台胞陆续经厦金航线抵厦参加海峡论坛,十八禁毛片一区二区,www.qztv.cc,久久九九手机板看a片免费视频,国产农村美女自拍网
01月11日|财政部:2023年中央财政安排基本养老保险补助资金约1万亿元|日韩一区免费三级片|一级A片刺激高潮久久|99视频10精品视频在线观看|黄色视频在线免费
01月11日|多国华裔青少年在北京体验传统与科技碰撞之旅|色网站免费看|欧洲激情一区二区三区视频|小志和谷玉霞|狂野欧美激性XXXX
01月11日|特斯拉入华10年 中国车主超170万|老公在洗澡我被公干日本|国产a视频精品免费观看|黄页网站在线观看免费视频|女子被迷昏全部视频
以军对加沙南部地区发动海陆空袭击,广州花都买新房可享准户口?当地回应|(巴黎奥运)中国女排无缘四强 中国三大球全部出局|好爽高潮视频网站免费|本国自拍黄|男生把坤坤 进女生的桃里草莓视频|李丽珍裸体大乳喂奶
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
中国财长撰文:加快落实一揽子隐性债务化解政策
澳门今年上半年旅客总消费超377亿澳门元 同比增长16.4%
五年来首次访欧!习主席欧洲三国之行这些看点值得关注
新疆首条定期国际货运航线通航
遇见福建:千年古寺雪景迷人
香港启德体育园首次试运营 预计明年一季度整体投用
中新健康丨国内外心脑血管领域权威专家共绘疾病联合防控新路径
国务院关于《宁波市国土空间总体规划(2021—2035年)》的批复
“五一”假期福建口岸出入境旅客超10万人次
采访归来话感悟——春天的盛会 欣欣向荣的中国
能看h的网站
99国产精品一区视频
裸体+光屁屁+搂胸外国
海贼王黄漫
亚洲福利激情精品a毛片AV
韩国一级做a爰片久久毛片
国产农村妓女一级毛片
日韩人妻无码专区精品系列
墨烂花蕊,磨平豆豆
欧美人禽动交

闽公网安备 35010302000113号