首页
新智元报道
编辑:LRST
【新智元导读】DeepSeek-OCR的视觉文本压缩(VTC)手艺通过将文本编码为视觉Token,实现高达10倍的压缩率,大幅降低大模子处置惩罚长文本的本钱。可是,视觉语言模子能否明确压缩后的高密度信息?中科院自动化所等推出VTCBench基准测试,评估模子在视觉空间中的认知极限,包括信息检索、关联推理和恒久影象三大使命。
近期,DeepSeek-OCR依附其立异的「视觉文本压缩」(Vision-Text Compression, VTC)范式引发了手艺圈的高度关注,以少少的视觉Token实现高效的文本信息编码,为长文本处置惩罚开发了新路径。
这一突破性希望让大模子处置惩罚超长文档的本钱大幅降低,但也抛出了一个焦点问题:当长文本被高度压缩为2D图像后,视觉语言模子(VLM)真的能明确其中的内容吗?
为相识答这一疑问,来自中科院自动化所、中国科学院香港立异研究院等机构的研究团队推出了首个专门针对视觉-文本压缩范式的基准测试——VTCBench。
论文链接:https://arxiv.org/abs/2512.15649
VTCBench链接: https://github.com/Moenupa/VTCBench
VLMEvalKit链接:https://github.com/bjzhb666/VLMEvalKit
Huggingface链接: https://huggingface.co/datasets/MLLM-CL/VTCBench
图 1:视觉-文本压缩 (VTC) 流程演示及VTCBench
与古板大模子直接读取成千上万的纯文本Token差别,VTC范式(如DeepSeek-OCR)先将长文档渲染 (Rendering)为高密度的2D图像,再由视觉编码器转化为少量的视觉Token。
该手艺可实现2倍至10倍的Token压缩率,显著降低了长文本处置惩罚时的盘算与显存开销。
VTCBench现已在GitHub和Huggingface周全开源,其衍生版本VTCBench-Wild是一个统一的、全方位评估模子在重大现实场景下视觉文本压缩的鲁棒性,现已集成到VLMevalkit。
焦点使命
权衡「看得见」之后的「看得懂」
现在的VLM也许能精彩地完成OCR识别,但在处置惩罚 VTC 压缩后的高密度信息时,其长文本明确能力仍存疑。
VTCBench通过三大使命,系统性地评估模子在视觉空间中的认知极限:
1.VTC-Retrieval (信息检索):在视觉「大海」中寻找特定事实的「针」(Needle-in-a-Haystack),测试模子对空间漫衍信息的捕获能力。
2.VTC-Reasoning (关联推理):挑战模子在险些没有文本重叠的情形下,通过关联推理寻找事实,逾越纯粹的词汇检索。
3.VTC-Memory (恒久影象):模拟超长对话,评估模子在视觉压缩框架下,抵御时间与结构性信息衰减的能力。
别的,团队同步推出了VTCBench-Wild,引入 99 种差别的渲染设置(涵盖多种字体、字号、行高及配景),全方位检测模子在重大现实场景下的鲁棒性。
揭秘视觉压缩背后的认知瓶颈
图 2:VTCBench针对模子在长图像中检索信息的热力争。横轴代表上下文长度,纵轴代表要害事实(Needle)在文档中的深度。展现了模子体现的「迷失」与突破。
测试效果泛起出显著的「U 型曲线」:与文本模子类似,视觉语言模子(VLM)能够精准捕获开头和最后的信息,但关于中心部分的事实,明确能力会随着文档变长而强烈衰退。这证实晰纵然在视觉空间,模子依然保存严重的「空间注重力私见」,是未来 VTC 架构优化的要害偏向。
行业洞察
视觉压缩是长文本的终局吗?
通过对GPT、Gemini、Claude、QwenVL、InternVL、Gemma、KimiVL、Seed1.5等10余种尖端模子的深度评测,可以发明:
虽然VTC极大提升了效率,但现有VLM在重大推理和影象使命上的体现仍普遍弱于纯文本LLM;
消融实验证实,信息密度是决议模子性能的要害因素,直接影响视觉编码器的识别精度;
Gemini-3-Pro在VTCBench-Wild上体现惊艳,其视觉明确能力已险些追平其纯文本基准,证实晰VTC是实现大规模长文本处置惩罚的极其可行的路径!
总结
若是说古板的长文本处置惩罚是「逐字阅读」,那么DeepSeek-OCR所引领的VTC范式就是「过目成诵」的摄影式影象。VTCBench的泛起,正是为了确保模子在拥有这种「超能力」的同时,依然能够读懂字里行间的微言大义。
参考资料:
https://arxiv.org/abs/2512.15649
秒追ASI
?点赞、转发、在看一键三连?
点亮星标,锁定新智元极速推送!
《一级国产夫妻黄色AV》,《Q8X2R7L1T4J5M9B6W3》99riAV无码国产在线看
“一级好看毛片”
小 伸进 3D
……
01月10日
“3d成人无码动漫 在线观看”教资考试难度
↓↓↓
01月10日,康巴诺尔杯·2024 第八届康保马拉松鸣笛开跑,欧洲无码二区,18 视频软件,中文字幕一区二区人妻无广告,永久免费 d站免费
01月10日,“十五运·十五城”宣传活动首站将于12月18日走进北京,欧美性爱电影一级,天堂日韩无码,八酱和榜一大哥视频资料,偷偷色最黄毛片
01月10日,2024架无人机盘旋浙江山城 科技“游龙”点亮“龙抬头”,日韩欧美性爱视频,近親族強姦亂伦影片,亚洲永久精品国产,18 秘 漫画免费网站入口
01月10日|向全球艺术家征集作品 首届北戴河·大不同国际装置艺术展7月开展|www.先锋影音资源站.com|成人 高潮片免费白狐网站|馒头B被操|国产高清毛片视频在线播
01月10日|北方大部升温显著华北最高温直逼20℃ 南方13日起迎大范围阴雨|91吃瓜爆料黑料网曝门|rule34巨乳|51成人|人人操人人人人人人干人人操人人
01月10日|一季度中国财政收入60877亿元|色七七桃色综合|欧洲自拍另类欧美综合图片区|久久九九精品视频-九九精品一品道视频-久久精品国……|全黄做爰100分钟视频……
01月10日,总装机规模150万千瓦风电项目在“中国风谷”开工,欧美性爱添添添添,jav小蝌蚪蘑菇视频,黄色网站在线免费进,人人干人人草人人摸
01月10日,专家:房地产转向“存量更新运营” 住房租赁市场迎发展新阶段,农民伯伯下乡妹2国语版电影免费观看,精品tv一区在线观看,国产3p视频网站,黄色网站在线免费观看亚洲
01月10日|陕西:以检察履职支撑特殊群体权益保护|欧美综合在线视频观看|欧美可直接观看的AAAA片|免费一级A片26分钟|污18禁网站在线永久免费观看
01月10日,跟随赛事推介城市 “世运蓉港行”主题列车发行,婬妇一级毛片免费看体验区,国产级自拍视频,黄色国产精品视频,国产另类重口调教在线
01月10日,河北公益诉讼检察案件六成为生态环境和资源保护案件,cao黄色网站,蓬莱山一级裸体片,操逼α片,国产91最新资源网址
01月10日,广西横州市发生一起交通事故致4人死亡,国产精品无码三级在线播放一区,人人摸人人操人人草,美女视频视黄a美人,国产优品
01月10日|浙江柯桥纺织品热销欧洲 可再生、功能性面料受青睐|a一级免费毛片视频|老湿av|免费人成视频在线观看免费|黄色片视频
01月10日|美国青年泛舟杭州西湖 感受世遗魅力|美女夺逼|色一区色二区|英雄联盟美女之动漫被草|免费看美女隐私软件
01月10日|北京政协委员建言营商环境提升 助力民营企业发展|性欧美XXXX乳在线观看|亚洲国产黄片全区|久草小视频|奸插舔阴户动漫
iPhone16或取消实体音量键电源键,国台办回应网上出现“武统”声音|今年“五一”火车票仍然难买!有什么解决办法吗?|免费看裸体动漫美女|mogu3.|清风阁免费A片视频网|美女裸体游戏
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
哇!Chinese Kungfu!中国传统体育项目点燃巴黎街头
青海乌兰虹鳟鱼养殖成功上市销售
新疆机场集团首条定期国际货运航线通航
广西侗乡三江:木耳丰收采摘忙
受雨雪冰冻天气影响 广铁部分列车停运
现场点交、包机货运 揭秘近800件埃及文物如何抵达上海
文明遇鉴|中埃两大文明古国在这里开启跨时空“对话”
连续错失点球!外媒称姆巴佩精神状况出现问题
广西加快构建“粤港澳大湾区—北部湾经济区—东盟”跨境产业链供应链
在拉美最古老的唐人街寻味中国
欧美黄色视频中国
国产起碰人人爽模人人APP
www.桃色
欧美日韩午夜综合视频
日韩大片免费观看视频播放
天天狠天天拍天天通在线
老师胸乳 裸露
无码视频黄片
新有菜官网midv
国产熟女老妇乱视频

闽公网安备 35010302000113号