(6秒完整评测)嫩草网站入口免费观看电脑版v03.07.04.961.99.216.607.1-2265安卓网

k1体育麻将胡了

搜索 猫眼影戏 融媒体矩阵
  • 山东手机报

  • 猫眼影戏

  • 公共网官方微信

  • 公共网官方微博

  • 抖音

  • 人民号

  • 天下党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

DeepSeek-OCR是「长文本明确」未来偏向吗?中科院新基准给出谜底

2026-01-07 14:40:26
泉源:

猫眼影戏

作者:

杭甬

手机审查

  猫眼影戏记者 萨米·阿布·泽尔 报道Q8X2R7L1T4J5M9B6W3

新智元报道

编辑:LRST

【新智元导读】DeepSeek-OCR的视觉文本压缩(VTC)手艺通过将文本编码为视觉Token,实现高达10倍的压缩率,大幅降低大模子处置惩罚长文本的本钱。可是,视觉语言模子能否明确压缩后的高密度信息?中科院自动化所等推出VTCBench基准测试,评估模子在视觉空间中的认知极限,包括信息检索、关联推理和恒久影象三大使命。

近期,DeepSeek-OCR依附其立异的「视觉文本压缩」(Vision-Text Compression, VTC)范式引发了手艺圈的高度关注,以少少的视觉Token实现高效的文本信息编码,为长文本处置惩罚开发了新路径。

这一突破性希望让大模子处置惩罚超长文档的本钱大幅降低,但也抛出了一个焦点问题:当长文本被高度压缩为2D图像后,视觉语言模子(VLM)真的能明确其中的内容吗?

为相识答这一疑问,来自中科院自动化所、中国科学院香港立异研究院等机构的研究团队推出了首个专门针对视觉-文本压缩范式的基准测试——VTCBench。

论文链接:https://arxiv.org/abs/2512.15649

VTCBench链接: https://github.com/Moenupa/VTCBench

VLMEvalKit链接:https://github.com/bjzhb666/VLMEvalKit

Huggingface链接: https://huggingface.co/datasets/MLLM-CL/VTCBench

图 1:视觉-文本压缩 (VTC) 流程演示及VTCBench

与古板大模子直接读取成千上万的纯文本Token差别,VTC范式(如DeepSeek-OCR)先将长文档渲染 (Rendering)为高密度的2D图像,再由视觉编码器转化为少量的视觉Token。

该手艺可实现2倍至10倍的Token压缩率,显著降低了长文本处置惩罚时的盘算与显存开销。

VTCBench现已在GitHub和Huggingface周全开源,其衍生版本VTCBench-Wild是一个统一的、全方位评估模子在重大现实场景下视觉文本压缩的鲁棒性,现已集成到VLMevalkit。

焦点使命

权衡「看得见」之后的「看得懂」

现在的VLM也许能精彩地完成OCR识别,但在处置惩罚 VTC 压缩后的高密度信息时,其长文本明确能力仍存疑。

VTCBench通过三大使命,系统性地评估模子在视觉空间中的认知极限:

1.VTC-Retrieval (信息检索):在视觉「大海」中寻找特定事实的「针」(Needle-in-a-Haystack),测试模子对空间漫衍信息的捕获能力。

2.VTC-Reasoning (关联推理):挑战模子在险些没有文本重叠的情形下,通过关联推理寻找事实,逾越纯粹的词汇检索。

3.VTC-Memory (恒久影象):模拟超长对话,评估模子在视觉压缩框架下,抵御时间与结构性信息衰减的能力。

别的,团队同步推出了VTCBench-Wild,引入 99 种差别的渲染设置(涵盖多种字体、字号、行高及配景),全方位检测模子在重大现实场景下的鲁棒性。

揭秘视觉压缩背后的认知瓶颈

图 2:VTCBench针对模子在长图像中检索信息的热力争。横轴代表上下文长度,纵轴代表要害事实(Needle)在文档中的深度。展现了模子体现的「迷失」与突破。

测试效果泛起出显著的「U 型曲线」:与文本模子类似,视觉语言模子(VLM)能够精准捕获开头和最后的信息,但关于中心部分的事实,明确能力会随着文档变长而强烈衰退。这证实晰纵然在视觉空间,模子依然保存严重的「空间注重力私见」,是未来 VTC 架构优化的要害偏向。

行业洞察

视觉压缩是长文本的终局吗?

通过对GPT、Gemini、Claude、QwenVL、InternVL、Gemma、KimiVL、Seed1.5等10余种尖端模子的深度评测,可以发明:

虽然VTC极大提升了效率,但现有VLM在重大推理和影象使命上的体现仍普遍弱于纯文本LLM;

消融实验证实,信息密度是决议模子性能的要害因素,直接影响视觉编码器的识别精度;

Gemini-3-Pro在VTCBench-Wild上体现惊艳,其视觉明确能力已险些追平其纯文本基准,证实晰VTC是实现大规模长文本处置惩罚的极其可行的路径!

总结

若是说古板的长文本处置惩罚是「逐字阅读」,那么DeepSeek-OCR所引领的VTC范式就是「过目成诵」的摄影式影象。VTCBench的泛起,正是为了确保模子在拥有这种「超能力」的同时,依然能够读懂字里行间的微言大义。

参考资料:

https://arxiv.org/abs/2512.15649

秒追ASI

?点赞、转发、在看一键三连?

点亮星标,锁定新智元极速推送!

??时势1:超碰在线观看图片区

??01月07日,中欧班列“东通道”通行量突破2000列,

  优化一个总部:就是实验总部经济,通过优化广州总部,形成发动华南、辐射天下的营运名堂,把广州总部做精、做强、做美,实现聚宝盆经济目的。

,亚洲无码高清三级片。

??01月07日,2024重庆道地优势药材交易博览会开幕 吸引民众体验中医药文化,

  石林虎则一摆手,道:“别说空话,我们不爱听,说吧,怎么赔偿我们?”

,国产做受 高潮五人,黄的免费视频,亚洲精品第一国产综合精品。

??时势2:亚洲AV无码一区二区三区桃色

??01月07日,香港马拉松将于21日举行 7.4万名跑手参与赛事,

  一声咆哮震惊八荒,即便苍莽山脉最外围,也能听到那重大的声音,正在逃遁的诸强全身发软,许多人瘫在了地上。

,免费黄色视频大全在线看,唐舞桐涩乱,触手钻进了护士的私密部位。

??01月07日,海外华文媒体在沪体验“苏河万象” 看百年变迁,

  能进入虚神界,就是自上古神明那里继续下的“宝藏”之一。只要信仰稳固,在这片古国境内,每年举行祭祀,强者就可感知到虚神界。

,禁止观看强奷视频A级毛片,在线精品播放,七猫网页版进入官方版下。

??时势3:一级a片久久免费

??01月07日,《繁花》热播牵出浙江金华火腿“沪上礼事”,

  “嗯,我知道,那些刻图太深奥了,还不是我能参悟的领域,一切逐步来就好了。”小不点听从劝告,认真总结。

,性巴克app 破解版网站成人版,久久国产一级特黄AA大片,国产精品欧美精品国产主播。

??01月07日,国务院听到了你的声音,

  毫无疑问,这是一件大杀器,不然怎能造成那么大的杀劫?若是对敌时,此剪一出,简直无物不破。

,天天久久狼狼色综合,AAA欧美A片,91吃瓜在线。

??时势4:欧美性猛交 富婆辛迪-DVD免费

??01月07日,数字人民币在微信内应用“扩容” 已接入数百万家商户,

  一是希望所有团员要做学习的楷模。

,困困兔自愈原视频,欧美A级屌屄视频,毛片网页在线观看。

??01月07日,年轻人成带头人,非遗工坊从乡村走向世界,

  为期一天的村干部培训班即将竣事。培训会上,邹书记从战略的高度对做好新时期镇村干部培训事情做了很好的发动和安排,分线分块的向导也从理论和营业方面划分给我们举行了全心的解说。我以为无论是邹书记的发动,照旧其它向导的专题向导,都具有很强的针对性、指导性和实践性。各人回去后一定要认真学习,深刻体会,抓好贯彻落实。下面我就此次培训班的举行情形再讲几点意见:

,啊啊啊骚护士视频,美乳高潮在线超碰,年轻人爱看的毛片。

【宁夏:多举措缓解工业企业融资难题】

【和评理|坚决反对美国滥用出口管制措施】

责编:阮晨

审核:卡普曼

责编:明磊

相关推荐 换一换

Copyright (C) 2001-   dzwww.com. All Rights Reserved

新闻信息效劳允许证 - 音像制品出书允许证 - 广播电视节目制作谋划允许证 - 网络视听允许证 - 网络文化谋划允许证

山东省互联网传媒集团主理  联系电话:0531-85193202  违法不良信息举报电话:0531-85196540

鲁ICP备09023866号-1   鲁公网安备 37010202000111号  

Copyright (C) 2001- Dzwww   鲁ICP备09023866号-1

网站地图