猫眼影戏
猫眼影戏
蔡贞安
手机审查
猫眼影戏记者 杨月欣 报道Q8X2R7L1T4J5M9B6W3
新智元报道
编辑:LRST
【新智元导读】DeepSeek-OCR的视觉文本压缩(VTC)手艺通过将文本编码为视觉Token,实现高达10倍的压缩率,大幅降低大模子处置惩罚长文本的本钱。可是,视觉语言模子能否明确压缩后的高密度信息?中科院自动化所等推出VTCBench基准测试,评估模子在视觉空间中的认知极限,包括信息检索、关联推理和恒久影象三大使命。
近期,DeepSeek-OCR依附其立异的「视觉文本压缩」(Vision-Text Compression, VTC)范式引发了手艺圈的高度关注,以少少的视觉Token实现高效的文本信息编码,为长文本处置惩罚开发了新路径。
这一突破性希望让大模子处置惩罚超长文档的本钱大幅降低,但也抛出了一个焦点问题:当长文本被高度压缩为2D图像后,视觉语言模子(VLM)真的能明确其中的内容吗?
为相识答这一疑问,来自中科院自动化所、中国科学院香港立异研究院等机构的研究团队推出了首个专门针对视觉-文本压缩范式的基准测试——VTCBench。
论文链接:https://arxiv.org/abs/2512.15649
VTCBench链接: https://github.com/Moenupa/VTCBench
VLMEvalKit链接:https://github.com/bjzhb666/VLMEvalKit
Huggingface链接: https://huggingface.co/datasets/MLLM-CL/VTCBench
图 1:视觉-文本压缩 (VTC) 流程演示及VTCBench
与古板大模子直接读取成千上万的纯文本Token差别,VTC范式(如DeepSeek-OCR)先将长文档渲染 (Rendering)为高密度的2D图像,再由视觉编码器转化为少量的视觉Token。
该手艺可实现2倍至10倍的Token压缩率,显著降低了长文本处置惩罚时的盘算与显存开销。
VTCBench现已在GitHub和Huggingface周全开源,其衍生版本VTCBench-Wild是一个统一的、全方位评估模子在重大现实场景下视觉文本压缩的鲁棒性,现已集成到VLMevalkit。
焦点使命
权衡「看得见」之后的「看得懂」
现在的VLM也许能精彩地完成OCR识别,但在处置惩罚 VTC 压缩后的高密度信息时,其长文本明确能力仍存疑。
VTCBench通过三大使命,系统性地评估模子在视觉空间中的认知极限:
1.VTC-Retrieval (信息检索):在视觉「大海」中寻找特定事实的「针」(Needle-in-a-Haystack),测试模子对空间漫衍信息的捕获能力。
2.VTC-Reasoning (关联推理):挑战模子在险些没有文本重叠的情形下,通过关联推理寻找事实,逾越纯粹的词汇检索。
3.VTC-Memory (恒久影象):模拟超长对话,评估模子在视觉压缩框架下,抵御时间与结构性信息衰减的能力。
别的,团队同步推出了VTCBench-Wild,引入 99 种差别的渲染设置(涵盖多种字体、字号、行高及配景),全方位检测模子在重大现实场景下的鲁棒性。
揭秘视觉压缩背后的认知瓶颈
图 2:VTCBench针对模子在长图像中检索信息的热力争。横轴代表上下文长度,纵轴代表要害事实(Needle)在文档中的深度。展现了模子体现的「迷失」与突破。
测试效果泛起出显著的「U 型曲线」:与文本模子类似,视觉语言模子(VLM)能够精准捕获开头和最后的信息,但关于中心部分的事实,明确能力会随着文档变长而强烈衰退。这证实晰纵然在视觉空间,模子依然保存严重的「空间注重力私见」,是未来 VTC 架构优化的要害偏向。
行业洞察
视觉压缩是长文本的终局吗?
通过对GPT、Gemini、Claude、QwenVL、InternVL、Gemma、KimiVL、Seed1.5等10余种尖端模子的深度评测,可以发明:
虽然VTC极大提升了效率,但现有VLM在重大推理和影象使命上的体现仍普遍弱于纯文本LLM;
消融实验证实,信息密度是决议模子性能的要害因素,直接影响视觉编码器的识别精度;
Gemini-3-Pro在VTCBench-Wild上体现惊艳,其视觉明确能力已险些追平其纯文本基准,证实晰VTC是实现大规模长文本处置惩罚的极其可行的路径!
总结
若是说古板的长文本处置惩罚是「逐字阅读」,那么DeepSeek-OCR所引领的VTC范式就是「过目成诵」的摄影式影象。VTCBench的泛起,正是为了确保模子在拥有这种「超能力」的同时,依然能够读懂字里行间的微言大义。
参考资料:
https://arxiv.org/abs/2512.15649
秒追ASI
?点赞、转发、在看一键三连?
点亮星标,锁定新智元极速推送!
??时势1:清纯igao
??01月09日,创历史新高 2023年内蒙古外贸进出口总值达1965.3亿元,
“不必写下真实的信息,可以随便写一些,好比说最喜欢的、最爱的。”谁人盛意的少女提醒。
,国产精东原创在线视频。??01月09日,直击第三届阿拉木图美食节,
“爷爷尚有父亲说了,要我和你订婚,你什么时间允许?”石飞蛟的女儿高声问道。
,日本ww中文字幕高清在线,91色图,老公 你好大 轻点 视频。??时势2:就要日就要艹就要干
??01月09日,安徽池州:晚霞与彩虹同框,
第一,深刻熟悉召开第十一次党代会对学校生长的主要意义?玫炒崾墙ㄉ韪咚健⑻厣痛笱,作育立异人才,实现学?缭绞缴さ男枰。为国家经济建设和社会生长作育及格的建设者和可靠接棒人是高等院校坚持社会主义办学偏向的实质要求。我校第十次党代会召开以来,我们通过召开七次全委会,围绕着“作育什么人,怎样作育人”和“办什么样的大学,怎样办妥大学”等主要问题,以学科建设为龙头,实验学校人才强校战略,推进学科建设,增进申请优势学科平台,增强师资步队建设,推进高等教育质量工程等等,为推动学校刷新生长稳固提供了顽强的政治、头脑和组织包管。目今,我国正处在一个由高等教育大国向高等教育强国迈进的新的历史起点,学校的生长也进入到了一个要害的生长时期。国家对高等教育、作育立异人才提出了新的要求,建设立异型国家已经成为国家生长的战略焦点。作育具有立异精神和立异能力的优异拔尖人才,提升学校的办学水平和质量已经成为目今我们办学面临的一个主要问题。最近,在施建军校长的提倡下召开的学科建设钻研会、国际化工程启动会和博士生作育事情会等就捉住了我们学校学科建设、人才作育的要害。通过调研和讨论,全校教职员工、全校上下对学校的生长定位、生长战略和生长路径,在凝聚共识的基础上,进一步细化为实验。要把这些已经确定的共识、思绪和详细实验步伐酿成现实的效果,就需要全校上下、各级党组织和全体的支持、加入、团结全校师生员工来推进学校的生长。通过准备召开第十一次党代会,我们要认真总结已往近五年岁情中的履历和做法。特殊是党建事情围绕学校生长所做的事情,围绕学科建设、师资步队建设、人才作育,调动各方面起劲性和创立性,全力推进学校事业生长的履向来总结党的事情,提高党建事情的水平。
,中文字幕精品视频一区,久碰网站,免费一级全毛片。??01月09日,华商40余载逐梦挪威 用“三把钥匙”开启房地产人生,
令人欣慰的是,你们在六年中已经悄悄地长大了:你们的个子长高了,你们的身体结实了,你们的言论文雅了,你们的看法自力了,你们的品质成熟了……只管你们的声音尚有些稚嫩,你们的举止尚有些粗糙,你们的情绪尚有些乍寒乍热,但你们却实着实在地长大了。你们知道为什么会长大吗?有人会失笑:傻子都知道,是人都会长大,还用问为什么吗?着实,你们不知道,人也和世上的花卉树木、鸟兽虫鱼一样,之以是会长大,是由于心田都藏着一个相同的神秘:我就要!“我就要着花!”于是,野百合开遍了深山幽谷;“我就要生长!”于是,白杨树屹立在沙漠荒滩;“我就要翱翔!”于是,雏鹰展翅遨游蓝天!
,人人艹人操,无码精品人在线观看,妓女一级AA黄色视频。??时势3:日本学生妹强奸.性爱区
??01月09日,中国香港男子足球队以2比0战胜广东队 取得省港杯首回合胜利,
这次的兽潮正是有这头强盛的凶禽带队,它发出啸声,地面上的种种猛兽马上最先攻击,慑于其威,莫敢不从。
,日韩性爱高清喷水,婷婷五月丁香啪,操是人激。??01月09日,山西省政协委员邓洋:医育结合 为婴幼儿提供专业托育服务,
“要不,你就叫这个名字吧,我改一个。”小不点说道,这个孩子替他受了许多苦,他不想将他一直在用的名字也要走。
,免费人成网站线观看合集,国产精品女人视频一区二区三区,亚洲综合色网站。??时势4:国产欧美精品区一区二区三区孕妇
??01月09日,去年12月全国受理网络违法和不良信息举报1880.1万件,
“你开创的纪录跟人家一比差远了,你这是投契取巧,破损虚神界通道,人家那是真实拼杀出来的。”
,99超碰自拍,色视频人妖专区,国产黄色A片高清无码在线观看。??01月09日,2024“讲好中国故事”创意传播国际大赛“一带一路”主题赛启动,
站在新学期的新起点上,回首刚刚已往的一个学期,我们为同砚们的勤劳学习、锐意进取而倍感欣慰,我们为先生们的无私贡献、殚心勉力而深深感动。正是我们师生同心协力、配合起劲,我们的声誉在一直提高,我们的教学质量在一直提升,我们的生长也越来越多的受到社会各界鼎力大举体贴支持。在此,请允许我代表学校向先生和同砚们体现热烈的祝贺和衷心的谢谢!
,外国操逼网站,人人干综合,看老女人操逼视频。责编:张杰才
审核:屠海鸣
责编:库亚特
Copyright (C) 2001- Dzwww 鲁ICP备09023866号-1