猫眼影戏
猫眼影戏
肖丛虎
手机审查
猫眼影戏记者 田婉婷 报道Q8X2R7L1T4J5M9B6W3
新智元报道
编辑:LRST
【新智元导读】DeepSeek-OCR的视觉文本压缩(VTC)手艺通过将文本编码为视觉Token,实现高达10倍的压缩率,大幅降低大模子处置惩罚长文本的本钱。可是,视觉语言模子能否明确压缩后的高密度信息?中科院自动化所等推出VTCBench基准测试,评估模子在视觉空间中的认知极限,包括信息检索、关联推理和恒久影象三大使命。
近期,DeepSeek-OCR依附其立异的「视觉文本压缩」(Vision-Text Compression, VTC)范式引发了手艺圈的高度关注,以少少的视觉Token实现高效的文本信息编码,为长文本处置惩罚开发了新路径。
这一突破性希望让大模子处置惩罚超长文档的本钱大幅降低,但也抛出了一个焦点问题:当长文本被高度压缩为2D图像后,视觉语言模子(VLM)真的能明确其中的内容吗?
为相识答这一疑问,来自中科院自动化所、中国科学院香港立异研究院等机构的研究团队推出了首个专门针对视觉-文本压缩范式的基准测试——VTCBench。
论文链接:https://arxiv.org/abs/2512.15649
VTCBench链接: https://github.com/Moenupa/VTCBench
VLMEvalKit链接:https://github.com/bjzhb666/VLMEvalKit
Huggingface链接: https://huggingface.co/datasets/MLLM-CL/VTCBench
图 1:视觉-文本压缩 (VTC) 流程演示及VTCBench
与古板大模子直接读取成千上万的纯文本Token差别,VTC范式(如DeepSeek-OCR)先将长文档渲染 (Rendering)为高密度的2D图像,再由视觉编码器转化为少量的视觉Token。
该手艺可实现2倍至10倍的Token压缩率,显著降低了长文本处置惩罚时的盘算与显存开销。
VTCBench现已在GitHub和Huggingface周全开源,其衍生版本VTCBench-Wild是一个统一的、全方位评估模子在重大现实场景下视觉文本压缩的鲁棒性,现已集成到VLMevalkit。
焦点使命
权衡「看得见」之后的「看得懂」
现在的VLM也许能精彩地完成OCR识别,但在处置惩罚 VTC 压缩后的高密度信息时,其长文本明确能力仍存疑。
VTCBench通过三大使命,系统性地评估模子在视觉空间中的认知极限:
1.VTC-Retrieval (信息检索):在视觉「大海」中寻找特定事实的「针」(Needle-in-a-Haystack),测试模子对空间漫衍信息的捕获能力。
2.VTC-Reasoning (关联推理):挑战模子在险些没有文本重叠的情形下,通过关联推理寻找事实,逾越纯粹的词汇检索。
3.VTC-Memory (恒久影象):模拟超长对话,评估模子在视觉压缩框架下,抵御时间与结构性信息衰减的能力。
别的,团队同步推出了VTCBench-Wild,引入 99 种差别的渲染设置(涵盖多种字体、字号、行高及配景),全方位检测模子在重大现实场景下的鲁棒性。
揭秘视觉压缩背后的认知瓶颈
图 2:VTCBench针对模子在长图像中检索信息的热力争。横轴代表上下文长度,纵轴代表要害事实(Needle)在文档中的深度。展现了模子体现的「迷失」与突破。
测试效果泛起出显著的「U 型曲线」:与文本模子类似,视觉语言模子(VLM)能够精准捕获开头和最后的信息,但关于中心部分的事实,明确能力会随着文档变长而强烈衰退。这证实晰纵然在视觉空间,模子依然保存严重的「空间注重力私见」,是未来 VTC 架构优化的要害偏向。
行业洞察
视觉压缩是长文本的终局吗?
通过对GPT、Gemini、Claude、QwenVL、InternVL、Gemma、KimiVL、Seed1.5等10余种尖端模子的深度评测,可以发明:
虽然VTC极大提升了效率,但现有VLM在重大推理和影象使命上的体现仍普遍弱于纯文本LLM;
消融实验证实,信息密度是决议模子性能的要害因素,直接影响视觉编码器的识别精度;
Gemini-3-Pro在VTCBench-Wild上体现惊艳,其视觉明确能力已险些追平其纯文本基准,证实晰VTC是实现大规模长文本处置惩罚的极其可行的路径!
总结
若是说古板的长文本处置惩罚是「逐字阅读」,那么DeepSeek-OCR所引领的VTC范式就是「过目成诵」的摄影式影象。VTCBench的泛起,正是为了确保模子在拥有这种「超能力」的同时,依然能够读懂字里行间的微言大义。
参考资料:
https://arxiv.org/abs/2512.15649
秒追ASI
?点赞、转发、在看一键三连?
点亮星标,锁定新智元极速推送!
??时势1:91P0RNY九色露脸熟女
??01月09日,宁夏“警旅联动”促进出入境旅游业健康发展,
三头幼鸟欢快的冲了上去,享用美餐。
,美女乱插网站国产。??01月09日,2500只大熊猫雕塑亮相香港,
“它能有这样的心思?”一群人都受惊。
,欧美极端残忍变态另类,欧美深夜性爱,人人摸人人艹人人干。??时势2:66j8影院
??01月09日,广州康鹭片区更新规划公布实施,
一株焦黑的大柳树,只有一条嫩绿的枝条,在黑夜散发出一缕又一缕柔和的霞光,朦胧的光晕笼罩了整个村子。
?第二十七章 落幕,成人视频APP下载,伪娘deliver第一季的剧情简介,91无码人妻。??01月09日,中国气象局:多手段保证国家温室气体观测站网提质增效,
第三,小学晚课由轮班看守酿成专人向导。已往小学晚自习由先生轮班看守,这样的误差是先生不熟悉学生,又未便于治理,从20xx年最先,学校挑选了精兵强将,对晚班举行专职治理,从五点到七点,既向导学生作业同时又调动学生的起劲性。又投资几千元在各课堂装置了闭路电视,按期播放一些康健向上,适合学生寓目的电视节目,解决家长的后顾之忧。
,一级性交,免费在线网站你懂得,无码日韩毛片片aa免费。??时势3:国产成+人+综合+亚洲欧美丁香花
??01月09日,经济向好 民心向暖 山西扎实推进高质量发展,
四要增强监视检查。农村低保金是贫困农民的“救命钱”,必需不折不扣地用在最需要救助的难题群众身上。向导干部要带动深入下层检查督导,发明问题,实时解决。监察、审计部分要增强监视检查,发明优亲厚友和人情低保等征象要实时予以纠正,对事情职员加入套取低保资金的一定要从严查处。民政部分要增强营业检查,确保农村低保事情流程准确、步伐到位、希望顺遂。要流通群众监视渠道,宣布监视电话,起劲为群众政策咨询、来信来访和监视举报提供利便。
,美女黄网站色视频免费网手机版,性爱视频污一级片,馃崕馃崒xx。??01月09日,中国与东盟国家铁路货物过半由中老铁路运输,
要进一步破除制约城镇化生长的规章制度,修建城镇化生长的体制平台。一是建设城乡一律就业制度。继续整理限制农民进城就业的歧视性政谋划定,不得对外来职员进城从业设置障碍。党政机关、企事业单位在招录和事情职员时,不得举行户籍或地区限制。实验身份证治理,不得对外来职员从业设置任何歧视性的挂号项目。作废对外来从业职员及其用人单位的不对理收费。二是严酷劳动执法监察。严酷执行同工同酬和最低人为标准制度,严肃查处拖欠、克扣人为行为。三是强化就业和创业培训。整合种种培训资源,实验农村劳动力转移“阳光工程”。健全劳务输出网络,增强劳动力市场信息网络和人才资源库建设,建设成建制劳动输出基地,指导城乡富余职员有组织、成建制的劳务输出。给予返乡创业者与外资外商同期待遇,推动“回归工程”进一步生长。四是刷新户籍治理制度。逐步破除农业和非农业户口二元制治理模式,推行按现实栖身地举行挂号的户籍治理制度。五是加速“城中村”及近郊无地少地住民的转户程序。“城中村”和人均耕地少于亩的近郊住民,可凭证自愿转为城镇户口,纳入城镇统一治理。“城中村”和近郊转户住民在一定限期内可继续享受原整体的福利待遇,承包的土地和正当宅基地可以保存。六是完善社会包管制度。外来从业职员和“城中村”及近郊转户从业职员要纳入社会包管规模。用工单位或雇主必需为其办理城镇职工基本养老包管、医疗包管和工伤包管。同时,起劲生长城镇基础教育,刷新城镇医疗卫生条件,切实解决好群众看病难的问题。
,人人操人人操人人欧美,黄色免费看在线,黄色动态视频。??时势4:5060免费午夜一级
??01月09日,十四届全国人大二次会议第三场“部长通道”集中采访活动举行,
“它能有这样的心思?”一群人都受惊。
,国产精品夫妇激情久久,国产精品影视人人做人人,邪恶全彩☆堕落媚肉寒天。??01月09日,广西桂林:山水间奏响疗愈乐章,
马上就要结业了,我也要为母校做出一些孝顺,我会为弟弟妹妹树立一个好模范,以自己最好的效果往返报她。
,朵朵·Cn官网,久久久影院AAA免费看,91 xxxxx。【广东省纪委监委驻省工业和信息化厅纪检监察组一级调研员唐策被查】
【中国大熊猫保护研究中心:“福宝”体态外观无异常,精神及食欲正常】
责编:黄建中
审核:安·基
责编:史景迁
Copyright (C) 2001- dzwww.com. All Rights Reserved
新闻信息效劳允许证 - 音像制品出书允许证 - 广播电视节目制作谋划允许证 - 网络视听允许证 - 网络文化谋划允许证
山东省互联网传媒集团主理 联系电话:0531-85193202 违法不良信息举报电话:0531-85196540
Copyright (C) 2001- Dzwww 鲁ICP备09023866号-1