首页
新智元报道
编辑:LRST
【新智元导读】DeepSeek-OCR的视觉文本压缩(VTC)手艺通过将文本编码为视觉Token,实现高达10倍的压缩率,大幅降低大模子处置惩罚长文本的本钱。可是,视觉语言模子能否明确压缩后的高密度信息?中科院自动化所等推出VTCBench基准测试,评估模子在视觉空间中的认知极限,包括信息检索、关联推理和恒久影象三大使命。
近期,DeepSeek-OCR依附其立异的「视觉文本压缩」(Vision-Text Compression, VTC)范式引发了手艺圈的高度关注,以少少的视觉Token实现高效的文本信息编码,为长文本处置惩罚开发了新路径。
这一突破性希望让大模子处置惩罚超长文档的本钱大幅降低,但也抛出了一个焦点问题:当长文本被高度压缩为2D图像后,视觉语言模子(VLM)真的能明确其中的内容吗?
为相识答这一疑问,来自中科院自动化所、中国科学院香港立异研究院等机构的研究团队推出了首个专门针对视觉-文本压缩范式的基准测试——VTCBench。
论文链接:https://arxiv.org/abs/2512.15649
VTCBench链接: https://github.com/Moenupa/VTCBench
VLMEvalKit链接:https://github.com/bjzhb666/VLMEvalKit
Huggingface链接: https://huggingface.co/datasets/MLLM-CL/VTCBench
图 1:视觉-文本压缩 (VTC) 流程演示及VTCBench
与古板大模子直接读取成千上万的纯文本Token差别,VTC范式(如DeepSeek-OCR)先将长文档渲染 (Rendering)为高密度的2D图像,再由视觉编码器转化为少量的视觉Token。
该手艺可实现2倍至10倍的Token压缩率,显著降低了长文本处置惩罚时的盘算与显存开销。
VTCBench现已在GitHub和Huggingface周全开源,其衍生版本VTCBench-Wild是一个统一的、全方位评估模子在重大现实场景下视觉文本压缩的鲁棒性,现已集成到VLMevalkit。
焦点使命
权衡「看得见」之后的「看得懂」
现在的VLM也许能精彩地完成OCR识别,但在处置惩罚 VTC 压缩后的高密度信息时,其长文本明确能力仍存疑。
VTCBench通过三大使命,系统性地评估模子在视觉空间中的认知极限:
1.VTC-Retrieval (信息检索):在视觉「大海」中寻找特定事实的「针」(Needle-in-a-Haystack),测试模子对空间漫衍信息的捕获能力。
2.VTC-Reasoning (关联推理):挑战模子在险些没有文本重叠的情形下,通过关联推理寻找事实,逾越纯粹的词汇检索。
3.VTC-Memory (恒久影象):模拟超长对话,评估模子在视觉压缩框架下,抵御时间与结构性信息衰减的能力。
别的,团队同步推出了VTCBench-Wild,引入 99 种差别的渲染设置(涵盖多种字体、字号、行高及配景),全方位检测模子在重大现实场景下的鲁棒性。
揭秘视觉压缩背后的认知瓶颈
图 2:VTCBench针对模子在长图像中检索信息的热力争。横轴代表上下文长度,纵轴代表要害事实(Needle)在文档中的深度。展现了模子体现的「迷失」与突破。
测试效果泛起出显著的「U 型曲线」:与文本模子类似,视觉语言模子(VLM)能够精准捕获开头和最后的信息,但关于中心部分的事实,明确能力会随着文档变长而强烈衰退。这证实晰纵然在视觉空间,模子依然保存严重的「空间注重力私见」,是未来 VTC 架构优化的要害偏向。
行业洞察
视觉压缩是长文本的终局吗?
通过对GPT、Gemini、Claude、QwenVL、InternVL、Gemma、KimiVL、Seed1.5等10余种尖端模子的深度评测,可以发明:
虽然VTC极大提升了效率,但现有VLM在重大推理和影象使命上的体现仍普遍弱于纯文本LLM;
消融实验证实,信息密度是决议模子性能的要害因素,直接影响视觉编码器的识别精度;
Gemini-3-Pro在VTCBench-Wild上体现惊艳,其视觉明确能力已险些追平其纯文本基准,证实晰VTC是实现大规模长文本处置惩罚的极其可行的路径!
总结
若是说古板的长文本处置惩罚是「逐字阅读」,那么DeepSeek-OCR所引领的VTC范式就是「过目成诵」的摄影式影象。VTCBench的泛起,正是为了确保模子在拥有这种「超能力」的同时,依然能够读懂字里行间的微言大义。
参考资料:
https://arxiv.org/abs/2512.15649
秒追ASI
?点赞、转发、在看一键三连?
点亮星标,锁定新智元极速推送!
《www久久精品视频》,《Q8X2R7L1T4J5M9B6W3》真人黄色视频免费大全
“在线亚洲综合日本”
www.九色
……
01月09日
“96视频精品全部在线观看”倚天屠龙记
↓↓↓
01月09日,“中国经济拥有光明前景”(两会·读懂中国)在团结奋斗中不断实现人民对美好生活的向往,能下黄视频网战,国产区欧美区自拍区在线,女人与公猪交交zozo,亚洲无码激情
01月09日,在长春见青春!长春假日游线上线下玩到爆!独家调查河南大学大礼堂失火事件 最新回应→,婷婷国产天堂久久综合,人人人操人人看,人人插人摸操秋霞网,国产永久免费视频
01月09日,押加、轮子秋 青海团出征十二届全国少数民族传统体育运动会,av地址在线,有色视频哪里可以看自拍,西欧三级黄色网站,熟女视频久久性爱视频欧美综合视频
01月09日|“花架子”无用有害 形式主义必须治|在线观看av网站特黄大片|色色自拍五月天|男女激情爽爽爽在线观看|一区二区三区煌瑟在线
01月09日|东北茭白种植为盐碱地改良利用探索出新路径|2020年亚洲国产精品视频|3D动漫紧身裤|啊~哈 ~自己动|免费黄色视频应用网站
01月09日|最高检:高质效办理借款合同纠纷等金融案件 以金融安全促民生保障|18禁3000|国产精品一二三区私人网站|图片区偷拍区小说区|国产高潮流白浆喷水免费视频……
01月09日,阿尔山获评内蒙古首个国家级旅游度假区,毛片18禁,少妇午夜AAAAA视频,插女人阴道的视频,欧美性爱–嫩草影院
01月09日,三伏天“晒背”怎么晒?哪些人适合晒?专家详解,女人那个逼黄色网站,三级片免费网址,美女 裸体直播网站,国产在线精品免费
01月09日|10月中国快递发展指数提升 21.1%|色色999日韩女|日韩视频05|中文字幕一区二区五月花|捧起她娇臀猛烈冲刺H视频
01月09日,周忠和:中华海外联谊会促交流互鉴 助力中国建设科技强国,哪吒敖闰裸体被 涩涩内内,哪里有黄色网站,欧美一级A片在线视频,亚洲专区天堂网在线播放
01月09日,广州市政协常委霍启文建议南沙建国际人才特区,欧美日韩丝袜中文字幕在线,狼友网站在线观看免费,2021国产精品偷窥盗摄,A片黄色视频老片免费
01月09日,印尼西苏门答腊省强降雨 因灾死亡人数升至21人,ts紫苑在线观看,白丝校花 扒腿自慰,珍妮吃萝卜动画原片观看视频,18男生 男生 里片
01月09日|四川四姑娘山双桥沟冬日如画|免费看日韩A片一二三区|黄www色|国产一级Www在线观看免费|人人操人人干夜夜
01月09日|南京港进出港船舶吃水最大纪录被刷新|色色色,毛片|AV中文字幕电影1234|色色淫操|大鸡巴强操妇女嫩逼爽 30.67MB 549好评 国产国产人精品视频69 日本zzxxww 各国大屌操... 军人深喉舔脚调教母狗 国精区二区三区无玛 尻男女女女女SSOO乄乄 骚b展示特黄专区 日...
01月09日|律师解读仙剑四番位之争:双方合同均有效|在线观看永久免费视频网站|啊啊啊额啊轻点好大啊|免费看片子AV|美女少萝 爆乳 萌白酱
关雪 晴川,地狱公使 第二季|2024年考证时间表来了,你准备考哪个?|澳门1024手机在线观看|美女视频网|成本人在线观看视频网站|国内产一级毛片免费
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
广西梧州:百年骑楼城亮灯 喜迎八方来客
脂肪也分好坏 | 吃出健康来
从“跟随”向“首发”转变 多家外资金融机构持续加码投资中国
乌鲁木齐南山山花烂漫 成高温天避暑休闲胜地
“唐尧”基因组已取得历史性突破 意味着什么?
(身边的变化)旧街成新景 浙江温州城市老巷激发“夜经济”新活力
奔向梦想!2024希望工程·蒙牛少年足球公益行正式启动
上海入境游升温彰显“首站”实力
专家学者探讨新质生产力与长江经济带高质量发展
时隔12年夺回汤杯尤杯 国羽迈进新一代
日本美女祼装的视频
馃崋馃崋馃崋馃崙馃崙馃崙
国产一区精品在线
韩国女主播玩奶
live2d触摸18游戏
久久福利热久久免费精品
无码黄色大片
h全彩动漫无遮挡在线观看
黄色色视频
国产一级二级精品黄色网站视频

闽公网安备 35010302000113号