猫眼影戏
猫眼影戏
吴林彬
手机审查
猫眼影戏记者 陈世兰 报道Q8X2R7L1T4J5M9B6W3
新智元报道
编辑:LRST
【新智元导读】DeepSeek-OCR的视觉文本压缩(VTC)手艺通过将文本编码为视觉Token,实现高达10倍的压缩率,大幅降低大模子处置惩罚长文本的本钱。可是,视觉语言模子能否明确压缩后的高密度信息?中科院自动化所等推出VTCBench基准测试,评估模子在视觉空间中的认知极限,包括信息检索、关联推理和恒久影象三大使命。
近期,DeepSeek-OCR依附其立异的「视觉文本压缩」(Vision-Text Compression, VTC)范式引发了手艺圈的高度关注,以少少的视觉Token实现高效的文本信息编码,为长文本处置惩罚开发了新路径。
这一突破性希望让大模子处置惩罚超长文档的本钱大幅降低,但也抛出了一个焦点问题:当长文本被高度压缩为2D图像后,视觉语言模子(VLM)真的能明确其中的内容吗?
为相识答这一疑问,来自中科院自动化所、中国科学院香港立异研究院等机构的研究团队推出了首个专门针对视觉-文本压缩范式的基准测试——VTCBench。
论文链接:https://arxiv.org/abs/2512.15649
VTCBench链接: https://github.com/Moenupa/VTCBench
VLMEvalKit链接:https://github.com/bjzhb666/VLMEvalKit
Huggingface链接: https://huggingface.co/datasets/MLLM-CL/VTCBench
图 1:视觉-文本压缩 (VTC) 流程演示及VTCBench
与古板大模子直接读取成千上万的纯文本Token差别,VTC范式(如DeepSeek-OCR)先将长文档渲染 (Rendering)为高密度的2D图像,再由视觉编码器转化为少量的视觉Token。
该手艺可实现2倍至10倍的Token压缩率,显著降低了长文本处置惩罚时的盘算与显存开销。
VTCBench现已在GitHub和Huggingface周全开源,其衍生版本VTCBench-Wild是一个统一的、全方位评估模子在重大现实场景下视觉文本压缩的鲁棒性,现已集成到VLMevalkit。
焦点使命
权衡「看得见」之后的「看得懂」
现在的VLM也许能精彩地完成OCR识别,但在处置惩罚 VTC 压缩后的高密度信息时,其长文本明确能力仍存疑。
VTCBench通过三大使命,系统性地评估模子在视觉空间中的认知极限:
1.VTC-Retrieval (信息检索):在视觉「大海」中寻找特定事实的「针」(Needle-in-a-Haystack),测试模子对空间漫衍信息的捕获能力。
2.VTC-Reasoning (关联推理):挑战模子在险些没有文本重叠的情形下,通过关联推理寻找事实,逾越纯粹的词汇检索。
3.VTC-Memory (恒久影象):模拟超长对话,评估模子在视觉压缩框架下,抵御时间与结构性信息衰减的能力。
别的,团队同步推出了VTCBench-Wild,引入 99 种差别的渲染设置(涵盖多种字体、字号、行高及配景),全方位检测模子在重大现实场景下的鲁棒性。
揭秘视觉压缩背后的认知瓶颈
图 2:VTCBench针对模子在长图像中检索信息的热力争。横轴代表上下文长度,纵轴代表要害事实(Needle)在文档中的深度。展现了模子体现的「迷失」与突破。
测试效果泛起出显著的「U 型曲线」:与文本模子类似,视觉语言模子(VLM)能够精准捕获开头和最后的信息,但关于中心部分的事实,明确能力会随着文档变长而强烈衰退。这证实晰纵然在视觉空间,模子依然保存严重的「空间注重力私见」,是未来 VTC 架构优化的要害偏向。
行业洞察
视觉压缩是长文本的终局吗?
通过对GPT、Gemini、Claude、QwenVL、InternVL、Gemma、KimiVL、Seed1.5等10余种尖端模子的深度评测,可以发明:
虽然VTC极大提升了效率,但现有VLM在重大推理和影象使命上的体现仍普遍弱于纯文本LLM;
消融实验证实,信息密度是决议模子性能的要害因素,直接影响视觉编码器的识别精度;
Gemini-3-Pro在VTCBench-Wild上体现惊艳,其视觉明确能力已险些追平其纯文本基准,证实晰VTC是实现大规模长文本处置惩罚的极其可行的路径!
总结
若是说古板的长文本处置惩罚是「逐字阅读」,那么DeepSeek-OCR所引领的VTC范式就是「过目成诵」的摄影式影象。VTCBench的泛起,正是为了确保模子在拥有这种「超能力」的同时,依然能够读懂字里行间的微言大义。
参考资料:
https://arxiv.org/abs/2512.15649
秒追ASI
?点赞、转发、在看一键三连?
点亮星标,锁定新智元极速推送!
??时势1:黄色的网站在线视频
??01月11日,香港湾仔海滨首设智能无人售卖点,
“隐患险于明火,提防胜于救灾”,只有提前增强并牢靠科学防火知识,我们才华将身边的隐患彻底根除,让生命之花绽放出他应有的色彩,让我们行动起来,将消防清静知识普及举行究竟,向一直辛勤资助我们的最美消防员致敬。
,A片电影人人操。??01月11日,(聚焦中国高质量发展)浙江兰溪游埠古镇:人间烟火气创富增收,
体育活动、实验课、实训课及其他户外活动要严酷听从先生指挥,严守操作规程,不私自行动,避免种种清静事故的爆发。
,wwwwwww大屌内射粉逼高潮淫叫,插进去,,啊,,好爽,视频,美日韩操B视频。??时势2:欧美aaaaaaaaaa
??01月11日,流浪27年 湖南籍男子在江西龙南找到回家的路,
然而,真正有所相识的人,好比族长、尚有几位年岁很大的老人都全身发木,而石林虎、石飞蛟更是寒毛倒竖,不敢转动一下,怕激怒那只小红雀。
,A片免费看看看看看看看看看看,欧美日本第一福利视频,小受被c哭打桩机sm调教GV。??01月11日,台风“桃芝”预计14日趋近海南岛东部海面,
“喂,你们不是要抢我们的宝骨吗?过来拿啊。”一群娃子很是不忿,情绪稳固下来后,全都爆发了。
,全国最新国产精品视频,雷电将军裸身被 自慰喷水,可以在线观看黄色视频的网站。??时势3:媚黑母猪宣言推特图片大全
??01月11日,十四届全国人大二次会议第三场“代表通道”集中采访活动举行,
以前,我十分不遵守交通规则,现在通过这个讲座不可乱撞红灯。“走路要走人行道,不在路上打和闹,不起快车不抢道,拷右行走要记牢…”这首童谣是交警姨妈编写的,我们一定要切记。又一次,我闯马路,差一点和一辆自行车相撞,这是自行车速率慢,若是是货车呢?不就失去了名贵的性命吗?
,免费h在线观看视频网站,特黄特色免费全部视频,免费一级a毛片在线播放直播。??01月11日,【光明论坛】坚持守正创新 不断取得改革新突破,
说到人类与情形的关系,我们总是以为是件离自己很遥远的事情,着实不然,情形问题可以说就在我们的身边。最近几天,不知各人是否关注过一则报道,由于无锡太湖水域大面积暴发蓝藻,一夜之间,数百万市民的自来水无法正常使用,翻开水龙头,就闻到一阵臭烘烘的异味,水无法饮用,给人们的生涯带来了诸多未便。而造成这次蓝藻暴发的缘故原由是我们人类自己:工业污水源源一直地排放入太湖,太湖人工养殖业的太过开发,促使太湖水质的富营养化病症日益加重;加上无锡4月份平均气温比终年横跨1.8摄氏度,给蓝藻的生长提供了有利条件,蓝藻大宗滋生,水中的消融氧浓度降低,造成鱼虾、螺蛳等水生物殒命,太湖水面被一层厚厚的绿色物体周全笼罩,腐败的蓝藻引起水质急剧恶化。原本清亮的太湖水今日情形惊心动魄,太湖也在“忠言”所有人:若是人类肆意破损情形,大自然就会无情地抨击人类。
,digao5.con,玖玖在线精品观看视频,日本熟妇BBWHD。??时势4:91精品第一国产综合精品蜜芽
??01月11日,中国的反恐怖主义法律制度体系与实践,
小不点一惊,可是并没有恐惧,双手划动,指端浮现一片纹络,组成一个小月牙,被他握在了掌心中,猛力一挥,点点绚烂扩散,将所有弩箭所有击碎。
,精品在线观看播放AV免费,亚黄片免费观看,BBB在线。??01月11日,日本震区半个月有感地震达1400多次,
“你是谁人墟落中的孩子,竟然这么强盛?!”中年男子见小不点化解了他的火光术,马上一惊,他记性极好,竟想起在那里见过小不点了。
,2020无码,sweetfever return原神汉化,强奷乱码中文字幕在线视频。责编:曹中铭
审核:王光志
责编:柏特逊
Copyright (C) 2001- dzwww.com. All Rights Reserved
新闻信息效劳允许证 - 音像制品出书允许证 - 广播电视节目制作谋划允许证 - 网络视听允许证 - 网络文化谋划允许证
山东省互联网传媒集团主理 联系电话:0531-85193202 违法不良信息举报电话:0531-85196540
Copyright (C) 2001- Dzwww 鲁ICP备09023866号-1