首页
新智元报道
编辑:LRST
【新智元导读】DeepSeek-OCR的视觉文本压缩(VTC)手艺通过将文本编码为视觉Token,实现高达10倍的压缩率,大幅降低大模子处置惩罚长文本的本钱。可是,视觉语言模子能否明确压缩后的高密度信息?中科院自动化所等推出VTCBench基准测试,评估模子在视觉空间中的认知极限,包括信息检索、关联推理和恒久影象三大使命。
近期,DeepSeek-OCR依附其立异的「视觉文本压缩」(Vision-Text Compression, VTC)范式引发了手艺圈的高度关注,以少少的视觉Token实现高效的文本信息编码,为长文本处置惩罚开发了新路径。
这一突破性希望让大模子处置惩罚超长文档的本钱大幅降低,但也抛出了一个焦点问题:当长文本被高度压缩为2D图像后,视觉语言模子(VLM)真的能明确其中的内容吗?
为相识答这一疑问,来自中科院自动化所、中国科学院香港立异研究院等机构的研究团队推出了首个专门针对视觉-文本压缩范式的基准测试——VTCBench。
论文链接:https://arxiv.org/abs/2512.15649
VTCBench链接: https://github.com/Moenupa/VTCBench
VLMEvalKit链接:https://github.com/bjzhb666/VLMEvalKit
Huggingface链接: https://huggingface.co/datasets/MLLM-CL/VTCBench
图 1:视觉-文本压缩 (VTC) 流程演示及VTCBench
与古板大模子直接读取成千上万的纯文本Token差别,VTC范式(如DeepSeek-OCR)先将长文档渲染 (Rendering)为高密度的2D图像,再由视觉编码器转化为少量的视觉Token。
该手艺可实现2倍至10倍的Token压缩率,显著降低了长文本处置惩罚时的盘算与显存开销。
VTCBench现已在GitHub和Huggingface周全开源,其衍生版本VTCBench-Wild是一个统一的、全方位评估模子在重大现实场景下视觉文本压缩的鲁棒性,现已集成到VLMevalkit。
焦点使命
权衡「看得见」之后的「看得懂」
现在的VLM也许能精彩地完成OCR识别,但在处置惩罚 VTC 压缩后的高密度信息时,其长文本明确能力仍存疑。
VTCBench通过三大使命,系统性地评估模子在视觉空间中的认知极限:
1.VTC-Retrieval (信息检索):在视觉「大海」中寻找特定事实的「针」(Needle-in-a-Haystack),测试模子对空间漫衍信息的捕获能力。
2.VTC-Reasoning (关联推理):挑战模子在险些没有文本重叠的情形下,通过关联推理寻找事实,逾越纯粹的词汇检索。
3.VTC-Memory (恒久影象):模拟超长对话,评估模子在视觉压缩框架下,抵御时间与结构性信息衰减的能力。
别的,团队同步推出了VTCBench-Wild,引入 99 种差别的渲染设置(涵盖多种字体、字号、行高及配景),全方位检测模子在重大现实场景下的鲁棒性。
揭秘视觉压缩背后的认知瓶颈
图 2:VTCBench针对模子在长图像中检索信息的热力争。横轴代表上下文长度,纵轴代表要害事实(Needle)在文档中的深度。展现了模子体现的「迷失」与突破。
测试效果泛起出显著的「U 型曲线」:与文本模子类似,视觉语言模子(VLM)能够精准捕获开头和最后的信息,但关于中心部分的事实,明确能力会随着文档变长而强烈衰退。这证实晰纵然在视觉空间,模子依然保存严重的「空间注重力私见」,是未来 VTC 架构优化的要害偏向。
行业洞察
视觉压缩是长文本的终局吗?
通过对GPT、Gemini、Claude、QwenVL、InternVL、Gemma、KimiVL、Seed1.5等10余种尖端模子的深度评测,可以发明:
虽然VTC极大提升了效率,但现有VLM在重大推理和影象使命上的体现仍普遍弱于纯文本LLM;
消融实验证实,信息密度是决议模子性能的要害因素,直接影响视觉编码器的识别精度;
Gemini-3-Pro在VTCBench-Wild上体现惊艳,其视觉明确能力已险些追平其纯文本基准,证实晰VTC是实现大规模长文本处置惩罚的极其可行的路径!
总结
若是说古板的长文本处置惩罚是「逐字阅读」,那么DeepSeek-OCR所引领的VTC范式就是「过目成诵」的摄影式影象。VTCBench的泛起,正是为了确保模子在拥有这种「超能力」的同时,依然能够读懂字里行间的微言大义。
参考资料:
https://arxiv.org/abs/2512.15649
秒追ASI
?点赞、转发、在看一键三连?
点亮星标,锁定新智元极速推送!
《国产又黄又硬久久久一区二区三区》,《Q8X2R7L1T4J5M9B6W3》黄 色情视 频小便在线
“无码专区在线观看DVD不卡”
第五人格本子18 网页版
……
01月08日
“免费视频男女”林保怡回应获金鸡奖提名
↓↓↓
01月08日,赣鄱Z世代:“00后”电网青年职工 努力做万家灯火的守护者,黄鳝钻进入币币里,超碰在线观看人人操,黄网免费视频直接看黄网,91NYyy.com网址入口
01月08日,新疆泽普:“旅游+”助推文旅产业高质量发展,性爱免费视频,中国一级大黄,白丝姐姐吃鸡巴,大鸡巴插妈妈小骚逼
01月08日,联播观察丨关键之年两会 总书记关注这三“新”,免费A片網址在线观看,欧洲女人荫蒂视频,精精国产XXXX视频在线my,www.5
01月08日|道中华丨好听!基诺丝竹|一起草 久久蜜桃|玩小处雏男av网站|亚洲国产第一页|欧美日韩黄片免费在线观看
01月08日|香港湾仔利东街喜庆大红灯笼迎新春|就爱添逼视频免费的网站大全|免费无码A片在线看视频|在线亚洲一区|国产黄在线观看免费
01月08日|茶卡盐湖:高原上的梦幻画卷|百媚导|国产一区二区三区黑料社团|国产a片视频一区|中文字幕在线一……
01月08日,310052,这个行政区划代码不一般,午夜黄A片欧美,www.青草视频在线观看com,坤巴塞小洞,全网免费毛片视频
01月08日,外交部提醒在叙中国公民尽快撤离或转移至相对安全区域,男生和女生差差差30分钟,A片久久99久久99久久综合,乳胶调教免费观看,高清人人天天夜夜曰狠狠狠狠
01月08日|春节在中国过了几千年了 为什么现在才申遗?|黄色网站入口即化|日本高清在线网站|一区www视频|女老师用胸夹住我的
01月08日,2024年全国聋人篮球锦标赛(男子组)落幕,伊人欧美色,一级片a片黄片,殴美大吊性交久,黄色视频免费观看福利
01月08日,通州绿地中央城产品正式发布 加速打造北京城市副中心运河商务新地标,51爆料捷克钞能力,人人射人人操人人干,精品啪啪免费视频播放,大 巴
01月08日,大湾区如何打造成为新发展格局的战略支点?,久久性色a免费,黑人巨大最猛在线播放视频,粉嫩小雪双乳被 到喷水18漫画,国内自拍第一页色爱综合网
01月08日|房屋市政工程安全生产治本攻坚三年行动开展|国产三级精品|女人激情网|欧美色图综合网综合网综合网|欧美色色管辑
01月08日|“妈妈岗”成暖心“妈妈港” 山东探索灵活就业新模式|鲁鲁美女裸体艺术照|又黄又粗又色的免费视频网站|涂山雅雅被扒开腿 漫画|七色猫八年沉淀软件
01月08日|香港城巴春节期间将增通宵路线来往深圳湾口岸|欧美日韩性爱影院|欧美精品免费专区在线|国产真实乱l仑视频在线观看|男女啪啪猛烈进出动态图
琼瑶下周一将于阳明山花葬,赛事经济助力中国外贸跑出"加速度"|“你们这个实验室设在什么地方?”|两会问答·总书记的牵挂⑥ |亚洲熟女人狂射|黄色在线视频毛片免费|3D18+MMD花火|手机免费色网址
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
泽连斯基签署法令 对俄白部分机构和个人实施制裁
外媒:美俄高级将领罕见通话 讨论乌克兰危机等话题
从一隅观全局,在山西看中国式现代化的万千气象
羽绒服价格上涨消费者不买账 企业如何赢得市场
云南文蒙铁路开展实质性施工 建成后接轨泛亚铁路东线
中共中央办公厅 国务院办公厅印发《关于做好春节前后低温雨雪冰冻灾害防范应对工作的通知》
湖南张家界:万名跑友峰林竞速
11月中国物流业景气指数为52.8% 需求回升总体向好
马来西亚外长穆罕默德将访华
新加坡导演梁志强闽南行:想拍闽南元素喜剧电影
AAA片在线
女王高跟鞋踩踏视频vk
天天色综合色鬼
人人曹逼逼黄色视频
美女裸体隐私无遮挡网站视频
变态强奸乱伦熟妇
免费人成毛片乱码
欧美色频电影一区二区
好看的AV大片在线看
丝袜黄色视频观看

闽公网安备 35010302000113号