猫眼影戏
猫眼影戏
曾孙子
手机审查
猫眼影戏记者 王臻良 报道Q8X2R7L1T4J5M9B6W3
新智元报道
编辑:LRST
【新智元导读】DeepSeek-OCR的视觉文本压缩(VTC)手艺通过将文本编码为视觉Token,实现高达10倍的压缩率,大幅降低大模子处置惩罚长文本的本钱。可是,视觉语言模子能否明确压缩后的高密度信息?中科院自动化所等推出VTCBench基准测试,评估模子在视觉空间中的认知极限,包括信息检索、关联推理和恒久影象三大使命。
近期,DeepSeek-OCR依附其立异的「视觉文本压缩」(Vision-Text Compression, VTC)范式引发了手艺圈的高度关注,以少少的视觉Token实现高效的文本信息编码,为长文本处置惩罚开发了新路径。
这一突破性希望让大模子处置惩罚超长文档的本钱大幅降低,但也抛出了一个焦点问题:当长文本被高度压缩为2D图像后,视觉语言模子(VLM)真的能明确其中的内容吗?
为相识答这一疑问,来自中科院自动化所、中国科学院香港立异研究院等机构的研究团队推出了首个专门针对视觉-文本压缩范式的基准测试——VTCBench。
论文链接:https://arxiv.org/abs/2512.15649
VTCBench链接: https://github.com/Moenupa/VTCBench
VLMEvalKit链接:https://github.com/bjzhb666/VLMEvalKit
Huggingface链接: https://huggingface.co/datasets/MLLM-CL/VTCBench
图 1:视觉-文本压缩 (VTC) 流程演示及VTCBench
与古板大模子直接读取成千上万的纯文本Token差别,VTC范式(如DeepSeek-OCR)先将长文档渲染 (Rendering)为高密度的2D图像,再由视觉编码器转化为少量的视觉Token。
该手艺可实现2倍至10倍的Token压缩率,显著降低了长文本处置惩罚时的盘算与显存开销。
VTCBench现已在GitHub和Huggingface周全开源,其衍生版本VTCBench-Wild是一个统一的、全方位评估模子在重大现实场景下视觉文本压缩的鲁棒性,现已集成到VLMevalkit。
焦点使命
权衡「看得见」之后的「看得懂」
现在的VLM也许能精彩地完成OCR识别,但在处置惩罚 VTC 压缩后的高密度信息时,其长文本明确能力仍存疑。
VTCBench通过三大使命,系统性地评估模子在视觉空间中的认知极限:
1.VTC-Retrieval (信息检索):在视觉「大海」中寻找特定事实的「针」(Needle-in-a-Haystack),测试模子对空间漫衍信息的捕获能力。
2.VTC-Reasoning (关联推理):挑战模子在险些没有文本重叠的情形下,通过关联推理寻找事实,逾越纯粹的词汇检索。
3.VTC-Memory (恒久影象):模拟超长对话,评估模子在视觉压缩框架下,抵御时间与结构性信息衰减的能力。
别的,团队同步推出了VTCBench-Wild,引入 99 种差别的渲染设置(涵盖多种字体、字号、行高及配景),全方位检测模子在重大现实场景下的鲁棒性。
揭秘视觉压缩背后的认知瓶颈
图 2:VTCBench针对模子在长图像中检索信息的热力争。横轴代表上下文长度,纵轴代表要害事实(Needle)在文档中的深度。展现了模子体现的「迷失」与突破。
测试效果泛起出显著的「U 型曲线」:与文本模子类似,视觉语言模子(VLM)能够精准捕获开头和最后的信息,但关于中心部分的事实,明确能力会随着文档变长而强烈衰退。这证实晰纵然在视觉空间,模子依然保存严重的「空间注重力私见」,是未来 VTC 架构优化的要害偏向。
行业洞察
视觉压缩是长文本的终局吗?
通过对GPT、Gemini、Claude、QwenVL、InternVL、Gemma、KimiVL、Seed1.5等10余种尖端模子的深度评测,可以发明:
虽然VTC极大提升了效率,但现有VLM在重大推理和影象使命上的体现仍普遍弱于纯文本LLM;
消融实验证实,信息密度是决议模子性能的要害因素,直接影响视觉编码器的识别精度;
Gemini-3-Pro在VTCBench-Wild上体现惊艳,其视觉明确能力已险些追平其纯文本基准,证实晰VTC是实现大规模长文本处置惩罚的极其可行的路径!
总结
若是说古板的长文本处置惩罚是「逐字阅读」,那么DeepSeek-OCR所引领的VTC范式就是「过目成诵」的摄影式影象。VTCBench的泛起,正是为了确保模子在拥有这种「超能力」的同时,依然能够读懂字里行间的微言大义。
参考资料:
https://arxiv.org/abs/2512.15649
秒追ASI
?点赞、转发、在看一键三连?
点亮星标,锁定新智元极速推送!
??时势1:美女被cao免费观看网站软件
??01月08日,亿元重奖!伊利2023年年会圆满举行,御风踏浪拥抱美好2024,
79年前的今天,为拯救国家和民族的危亡,在中国共产党的向导下,其时的北平数千名学生走上陌头,举行了大规模的游行示威活动,发出了“阻止内战,一致对外”的呐喊。游行步队遭到了国民党军警的残酷镇压,严寒的冰水射向了示威游行的学生步队,恶狠狠的皮鞭抽向了赤手空拳的爱国青年,明晃晃的刺刀戳进了手无寸铁的学生胸膛,导致100多人受伤、30多人被捕。然而残酷的镇压并没有浇灭学生的爱国怒火,它越烧越旺,燃遍了大江南北,燃遍了神州大地,由此,轰轰烈烈地掀开了天下救亡运动的新热潮。
,女生棵身露大乳免费视频。??01月08日,节省百亿元 公募第二阶段降费落地,
7月5日下等,我们闪电小队的7名同砚到安阳市公安局交警支队旅行。
,男生困困放女生困困里视频,AAAA片免费久久久久久,黄页在线免费。??时势2:aa在线观看免费
??01月08日,上海:近距离直击冰雕艺术大师现场雕“龙”,
“是呀!尚有,飞蛟叔你们用的是什么武器,以前怎么没有见过?是不是必需明确骨文才华催动,叔,你们可真是雄壮与威武!”
,99re这里只有精品99在线3,薛凯琪吃黑肠原著h,国產黄色一級大片網站。??01月08日,习近平离京赴利马出席亚太经合组织第三十一次领导人非正式会议并对秘鲁进行国事访问,
今天xx月xx日是天下第xx个“119消防日”,今年“119消防日”宣传活动的主题是“人人加入消防,共享平安生涯”。提到消防,同砚们自然会想到令人毛骨悚然的火灾二字。是的,火,带给人们灼烁,付与人们温暖。可是火也吞噬了无数生命,留下了累累伤痕。我们不会遗忘,XX年11月24日破晓,俄罗斯莫斯科人民友谊大学学生宿舍爆发火灾,近200名学生受伤,41名学生殒命,其中,中国留学生受伤46人,殒命11人。这场大火用血淋淋的数字和凄切的价钱,给我们敲响了清静提防的警钟,警醒我们火灾是威胁一样平常学习、生涯清静的主要因素。身处职员麋集的校园的我们,应在脑海中恒久鸣响“119”警铃,提高防火意识和手艺。希望各人能做到“三懂”、“三会”。“三懂”即明确火灾的危险性,增强消防意识;明确火灾形成的原理,不玩火;明确火灾预防,起劲开展消防宣传。“三会”即学会火灾报警要领,学会使用灭火器扑救小火,学会火灾自护自救的要领。要时刻切记消防清静,学习消防知识,消除火灾隐患,防微杜渐,提防未然。
,思思热92,思思热96,男男艹,性小说图片。??时势3:www.九久久
??01月08日,吉林晒未来产业成绩单:续航1000公里氢能源列车 全世界最大的亚米级遥感卫星星座,
石云峰一阵犹豫,最后咬了咬牙,道:“将离火牛魔的赤红宝角尚有恶魔猿的手臂准备好,放血!”
,丰满束缚乱子XXXXX,户籍猎手会员激活码,717影视三级理论电影在线播放。??01月08日,“AI厨师”掌勺饭店 推动中国餐饮行业变化发展,
然而,让人受惊的事情爆发了,漫天雷光汹涌,将这根柳条淹没,可它却越发的青翠了,像是在被甘泉滋润,鲜嫩的竟要滴出水来。
,国产真人视频一区二区三区,女人被男人爽到吟的视频,日本奶汁.哺乳XX91在线。??时势4:久久综合色五月
??01月08日,吉林省推进老年助餐服务:让老人“暖胃”更“暖心”,
与此同时,通体火光冲天的离火牛魔,头上一只数米长的重大犄角连带着大片的血肉被狻猊一爪子给击断了下来,坠落在地。
?第九十八章 闯关,A级毛片无码免费真,萝莉在线免费观看,国产羞羞视频在线观看免费。??01月08日,广西因地制宜加强传统村落保护利用吸引游客,
诸多宫殿连忙飞了起来,像是落叶般,在这种狞恶下微缺乏道,此后又在高空中破损,化成灰尘。
,免费播放人成视频网站,99久久国产综合精品18,2021国内免费无码自拍视频网。【辽宁省贸促会经贸代表团出访马来西亚、印度尼西亚助力打造对外开放新前沿】
【广东岩溶石漠化、沙化地区植被盖度均超80%】
责编:林玮
审核:徐尹邓
责编:齐永章
Copyright (C) 2001- dzwww.com. All Rights Reserved
新闻信息效劳允许证 - 音像制品出书允许证 - 广播电视节目制作谋划允许证 - 网络视听允许证 - 网络文化谋划允许证
山东省互联网传媒集团主理 联系电话:0531-85193202 违法不良信息举报电话:0531-85196540
Copyright (C) 2001- Dzwww 鲁ICP备09023866号-1