首页
新智元报道
编辑:LRST
【新智元导读】DeepSeek-OCR的视觉文本压缩(VTC)手艺通过将文本编码为视觉Token,实现高达10倍的压缩率,大幅降低大模子处置惩罚长文本的本钱。可是,视觉语言模子能否明确压缩后的高密度信息?中科院自动化所等推出VTCBench基准测试,评估模子在视觉空间中的认知极限,包括信息检索、关联推理和恒久影象三大使命。
近期,DeepSeek-OCR依附其立异的「视觉文本压缩」(Vision-Text Compression, VTC)范式引发了手艺圈的高度关注,以少少的视觉Token实现高效的文本信息编码,为长文本处置惩罚开发了新路径。
这一突破性希望让大模子处置惩罚超长文档的本钱大幅降低,但也抛出了一个焦点问题:当长文本被高度压缩为2D图像后,视觉语言模子(VLM)真的能明确其中的内容吗?
为相识答这一疑问,来自中科院自动化所、中国科学院香港立异研究院等机构的研究团队推出了首个专门针对视觉-文本压缩范式的基准测试——VTCBench。
论文链接:https://arxiv.org/abs/2512.15649
VTCBench链接: https://github.com/Moenupa/VTCBench
VLMEvalKit链接:https://github.com/bjzhb666/VLMEvalKit
Huggingface链接: https://huggingface.co/datasets/MLLM-CL/VTCBench
图 1:视觉-文本压缩 (VTC) 流程演示及VTCBench
与古板大模子直接读取成千上万的纯文本Token差别,VTC范式(如DeepSeek-OCR)先将长文档渲染 (Rendering)为高密度的2D图像,再由视觉编码器转化为少量的视觉Token。
该手艺可实现2倍至10倍的Token压缩率,显著降低了长文本处置惩罚时的盘算与显存开销。
VTCBench现已在GitHub和Huggingface周全开源,其衍生版本VTCBench-Wild是一个统一的、全方位评估模子在重大现实场景下视觉文本压缩的鲁棒性,现已集成到VLMevalkit。
焦点使命
权衡「看得见」之后的「看得懂」
现在的VLM也许能精彩地完成OCR识别,但在处置惩罚 VTC 压缩后的高密度信息时,其长文本明确能力仍存疑。
VTCBench通过三大使命,系统性地评估模子在视觉空间中的认知极限:
1.VTC-Retrieval (信息检索):在视觉「大海」中寻找特定事实的「针」(Needle-in-a-Haystack),测试模子对空间漫衍信息的捕获能力。
2.VTC-Reasoning (关联推理):挑战模子在险些没有文本重叠的情形下,通过关联推理寻找事实,逾越纯粹的词汇检索。
3.VTC-Memory (恒久影象):模拟超长对话,评估模子在视觉压缩框架下,抵御时间与结构性信息衰减的能力。
别的,团队同步推出了VTCBench-Wild,引入 99 种差别的渲染设置(涵盖多种字体、字号、行高及配景),全方位检测模子在重大现实场景下的鲁棒性。
揭秘视觉压缩背后的认知瓶颈
图 2:VTCBench针对模子在长图像中检索信息的热力争。横轴代表上下文长度,纵轴代表要害事实(Needle)在文档中的深度。展现了模子体现的「迷失」与突破。
测试效果泛起出显著的「U 型曲线」:与文本模子类似,视觉语言模子(VLM)能够精准捕获开头和最后的信息,但关于中心部分的事实,明确能力会随着文档变长而强烈衰退。这证实晰纵然在视觉空间,模子依然保存严重的「空间注重力私见」,是未来 VTC 架构优化的要害偏向。
行业洞察
视觉压缩是长文本的终局吗?
通过对GPT、Gemini、Claude、QwenVL、InternVL、Gemma、KimiVL、Seed1.5等10余种尖端模子的深度评测,可以发明:
虽然VTC极大提升了效率,但现有VLM在重大推理和影象使命上的体现仍普遍弱于纯文本LLM;
消融实验证实,信息密度是决议模子性能的要害因素,直接影响视觉编码器的识别精度;
Gemini-3-Pro在VTCBench-Wild上体现惊艳,其视觉明确能力已险些追平其纯文本基准,证实晰VTC是实现大规模长文本处置惩罚的极其可行的路径!
总结
若是说古板的长文本处置惩罚是「逐字阅读」,那么DeepSeek-OCR所引领的VTC范式就是「过目成诵」的摄影式影象。VTCBench的泛起,正是为了确保模子在拥有这种「超能力」的同时,依然能够读懂字里行间的微言大义。
参考资料:
https://arxiv.org/abs/2512.15649
秒追ASI
?点赞、转发、在看一键三连?
点亮星标,锁定新智元极速推送!
《免费吃奶摸下面》,《Q8X2R7L1T4J5M9B6W3》成都丁香人才网师母最新消息
“国产AV普通话无码”
com.黄18
……
01月08日
“亚洲一级高清在线大黄毛片”南京大屠杀幸存者刘素珍去世
↓↓↓
01月08日,150余家国内外机器人企业将亮相2024世界机器人大会,mimiai论坛网站,班长被c 黄秘 触,动漫美女 光屁屁 无遮挡亲吻,欧美啪啪动态视频
01月08日,当广州遇见阿克苏——2024年读懂中国会议的双城文化交响曲,美女靠逼免费视频,影音先锋免费av网站,豆媒体免费在线观看,黄色视频一级黄色视频
01月08日,长三角铁路部门启动扫雪除冰应急响应,www久久com,99irav2,国产一区二区精品黄色,黄色视频在线免费亚洲
01月08日|海口打造“演艺之城”拉动消费|碧蓝航线黄改版|高清黄片免费观看|国产内射在线|在线黄色网站你懂
01月08日|新疆阿克苏地区乌什县发生7.1级地震 27趟列车运行受影响|靠逼软件下载|欧美性爱A片在线播放|www.黄片大全|免费萌白酱国产一区二区三区
01月08日|将非遗搬上舞台 四川一高校五四礼仪秀尽显文化魅力|杨颖的胸襟距离观察|日韩最大的男女视频网站|音影先锋资源|黄色网站免费大全高……
01月08日,相约“十四冬” 多彩冰雪季,巨乳 黄 无码,亚洲网站在线观看视频,爱搞视频天堂,蘑菇视频
01月08日,广州市一轿车与行人和电动自行车发生碰撞致11伤 肇事司机已被控制,精品三级久久久电影,中文字幕人妻人综合,女生被插喷水福利,国产美女1314视频
01月08日|中方:敦促美方停止纵容支持“台独”势力“以武谋独”|国产色色色视频网站|求可在线观看av的网站|wwwjiujiu|偷拍网视频
01月08日,为推进中国式现代化广泛凝心聚力,把双腿打开疯狂进出爽爽爽的视频,人人操人人乳,k频道国产分享系统,欧美肛交黄色视频
01月08日,16家海外华文媒体代表走进长沙 感受机遇中国下的“非长”精彩,又硬又大又长黄片,亚洲精品老熟妇无码,亚洲 日韩第 1页,浣肠屈辱の浣肠羞辱
01月08日,韩国中央选举管理委员会:戒严军占领该委员会明显违宪违法,国产gay+粗大+掰开+射精,操女生网站,一级黄片无毒免费在线,射h精品视频
01月08日|新疆乌什发生7.1级强震 阿克苏市区震感强烈民众户外避险|肏屄视频免费|美女免费网址|大乳女被入|国产视频播放
01月08日|洋主播说节气:这里的夏天,从“半山娘娘庙”的一碗乌米饭开始|成 人 app 在 线 视 频A片|啊啊啊啊插|www.oumeihuangse|非洲亚干操射
01月08日|农业农村部:春节期间“菜篮子”产品供给总量有保障|欧美性爱不卡综合在线|国产在线第1|放A片沟引老头老头恋老白毛老头|hdxxxx陈文媛
恋与深空登顶送十连,曝足协在亚洲杯前没有做换帅预案|宁夏永宁:“南果北种”再上新 福建农科院“如玉45”苦瓜试种成功结硕果|一级A片又大又粗又爽|成年人黄色免费网站|色爽交视频免费观看|在线中文字幕在线
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
道中华丨中华文明如何从早期形态凝聚为统一的广土聚族?听王延中讲教材的逻辑框架
俄罗斯宇航员科诺年科接任国际空间站站长
糖尿病须终身服药?这些情况可以“缓解”
南京民众踏青赏景沐浴三月春光
妈祖为何“定居”深山?探访闽南侨乡梅林“大山深处的妈祖庙”
攀岩亚少赛、全国青攀联赛相继在四川眉山举行
2023年中国GDP超126万亿元 同比增长5.2%
“心血管健康卫士”蔡菁菁:俯首为医 心系基层
福建书画名家进校园挥毫泼墨:翰墨飘香润童心
香港中资企业为百名中学生提供短期职业体验
十次啦国产精品91
黄色网站人人视频
在线专区欧美激情亚洲
视频福利网
高清 码
www..com十八
最近的2019中文字幕免费
欧美久久性爰视频
16岁女孩穿三角裤体罚
黄色黄片

闽公网安备 35010302000113号