97Tv2人人操,海量高清资源免费畅享,热门影视综艺一网打尽

k1体育麻将胡了

搜索 猫眼影戏 融媒体矩阵
  • 山东手机报

  • 猫眼影戏

  • 公共网官方微信

  • 公共网官方微博

  • 抖音

  • 人民号

  • 天下党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

ImageNet分数越高  ,天生反而越糊?iREPA给出诠释

2025-12-26 16:39:36
泉源:

猫眼影戏

作者:

巴图

手机审查

  猫眼影戏记者 杨明静 报道Q8X2R7L1T4J5M9B6W3

新智元报道

编辑:倾倾

【新智元导读】学霸的假话被揭穿!一篇来自Adobe Research的论文发明  ,高语义明确并不会提升天生质量  ,反而可能破损空间结构 。用iREPA简朴修改  ,削弱全局滋扰  ,天生质量连忙飙升  。

我们经;嵋苫螅何裁词泳跄W釉礁呒  ,天生效果反而越差?

最近  ,Adobe Research发了一篇论文  ,专门诠释了这个看起来有点变态、但重复泛起的征象 。

论文地点:https://arxiv.org/pdf/2512.10794

按直觉  ,模子要先知道「这是什么」  ,才华把它画出来 。

ImageNet上的分类准确率越高  ,说明模子的语义明确越强  ,天生的内容越稳固、越靠谱 。

但这篇论文给出的效果  ,完全相反:

一些在识别使命中体现平平、甚至看起来「很不智慧」的视觉编码器  ,反而能天生出结构更清晰、质量更高的图像 。

全局语义能力越强  ,天生反而越容易出问题 。

很可能我们从一最先  ,就误会了天生模子真正善于的是什么 。

为什么视觉模子越「智慧」  ,天生的反而越差?

先看一个已经被重复验证的事实:一个模子在ImageNet上的线性探测准确率越高  ,并不料味着它更适适用来做天生 。

最直观的例子是SAM2 。这是一个在识别使命里不出彩的模子  ,验证准确率只有24.1%  ,远低于主流视觉大模子 。

但当这些编码器被用于REPA时  ,SAM2的天生质量反而优于一批准确率横跨约60%的模子 。

SAM2的ImageNet验证准确率仅为24.1%  ,但在REPA框架下的天生gFID显着优于多种准确率凌驾70%的视觉编码器 。

这还不是某一个模子的无意体现 。

论文进一步较量了统一编码器家族中差别规模的模子  ,效果发明:模子越大、分类准确率越高  ,天生质量反而可能相似或更差 。

随着模子规模和分类准确率提升  ,天生gFID反而整体变差  ,批注这一征象并非由个体模子导致 。

显然  ,「高语义能力=好天生」这条默认路径  ,在大宗实验中并不建设  。

更要害的是  ,这种征象并不是噪声 。

在跨模子、跨设置的系统性剖析中  ,全局语义指标与天生质量之间的相关性始终很是弱 。

分类能力与天生质量险些无关  ,空间结构却高度相关 。左:线性探测准确率与天生 gFID 的相关性极弱(Pearson r=-0.26) 。中:空间结构指标(LDS)与天生质量泛起出显著强相关(Pearson r=-0.85) 。右:基于空间结构刷新的iREPA  ,在多种编码器上稳固优于REPA 。

论文进一步对多种视觉编码器做了相关性剖析  ,效果很是明确:

线性探测准确率与天生质量之间险些不保存相关性 。

相比之下  ,反应patch空间结构的指标  ,与天生质量泛起出极强的正相关关系 。

若是不是「明确多」  ,那天生模子究竟依赖的是什么?

重复确认会压扁空间结构

在明确了「高语义≠好天生」之后  ,真正的问题酿成了:

为什么模子越是重复确认  ,天生反而越容易出问题?

要害就是  ,全局语义会在天生历程中压扁空间结构 。

在天生使命中  ,模子并不是一次性输出图像  ,而是在训练和采样历程中  ,一直对局部patch之间的关系做判断 。

论文将这种能力归纳综合为「空间结构」:即相邻patch之间应坚持更高相似性  ,而远处patch不应被全局语义过早拉近 。

但当模子太过追谴责局语义一致性  ,好比通过CLS token   ,或对所有patch做全局平均来强化「这是什么」  ,这些局部差别就会被系统性地削弱 。

这种做法会导致一个直接效果:远景物体的patch  ,与本应无关的配景patch之间  ,泛起异常高的相似性 。

空间比照度下降  ,界线变得模糊  ,天生效果因此糊成一片 。

PE-G和WebSSL-1B在ImageNet上具有更高的分类准确率  ,但它们的空间自相似性显示  ,远景与配景被太过拉近  ,界线模糊 。相比之下  ,空间结构更清晰的SpatialPE-B  ,天生质量显著更好 。

研究员向模子中逐步加入全局语义信息  ,视察分类能力和天生质量的转变 。

效果如下图所示:

增强全局语义信息会损害天生质量

随着全局信息权重α从0增添到0.5  ,模子的线性探测准确率一连上升 。

但天生质量却显著下降  ,FID显着恶化 。

也就是说  ,「更懂这是什么」确着实爆发;但与此同时  ,模子也失去天生所依赖的空间结构 。

这并不是优化不充分的副作用  ,而是由于全局语义在天生阶段饰演了一个「过强约束」的角色 。

它让模子更快告竣结论  ,却也更早放弃了对局部结构的细腻描绘 。

既然语义会滋扰天生  ,iREPA选择退后一步

若是说前面的实验回覆了「问题出在哪」  ,那 iREPA 回覆的就是另一个问题:

既然全局语义会滋扰天生  ,那该怎么对齐体现  ,才不会把结构压扁?

iREPA给出了谜底 。它对原本的REPA训练流程做了两处很是简朴的修改  ,总共不到四行代码  。

第一处  ,是投影方法的改变 。

在标准REPA中  ,patch表征通;峋蒑LP投影层举行对齐 。

但论文指出  ,MLP在这一历程中容易混淆差别位置的信息  ,无意中削弱了空间比照度  。

因此  ,iREPA用一个3×3的卷积层(padding=1)替换了MLP投影 。

卷积的归纳偏置能保存局部邻域关系:相邻patch的相互影响被保存  ,远处区域则不会被过早混在一起  。

第二处修改  ,直接针对全局语义 。

iREPA在对齐历程中引入了一个空间归一化层  ,移除了patch特征中的全局均值分量   ,让模子专注于局部之间的差别与界线 。

iREPA怎样通过两处修改  ,恢复天生所需的空间结构 。 (a) 使用卷积投影替换MLP  ,可更好地保存局部空间关系 。 (b) 空间归一化层通过移除全局分量  ,提高patch之间的空间比照度 。 (c) 经由这两步修改后  ,iREPA天生的diffusion特征泛起出更清晰的空间结构 。

正是这两点改动  ,让iREPA在机制上与前一节的问题形成了严酷对应:

全局语义太强会抹平结构  ,那就在对齐阶段削弱全局分量、强化空间关系  。

效果也在意料之中 。

无论是在ImageNet规模的天生使命  ,照旧更高区分率的设置  ,亦或是文本到图像的多模态天生使命中  ,iREPA都体现出更快的收敛速率和更好的最终天生质量 。

更主要的是  ,这种提升并不依赖于某一个特定编码器 。

在差别模子规模、差别视觉主干网络、差别训练设置下  ,iREPA都能稳固刷新 。

这不但是一个技巧  ,而是顺着天生使命自己对结构的需求  ,把体现对齐这件事做得更榨取、更细腻 。

许多时间  ,我们讨论天生模子时  ,会下意识沿用一个标准 。

但这篇论文提醒了我们  ,天生并不是明确的自然下游 。

对天生来说  ,最主要的并不是「这是什么」  ,而是「哪些地方该靠近  ,哪些地方该脱离」 。

当我们一味强化全局语义  ,重复鞭策模子给出谜底  ,着实是在替它提前下结论 。

iREPA并没有试图让模子变得更智慧 。它做的更像是退后一步  ,把空间还给空间  ,把结构还给结构 。

效果不是明确能力的奔腾  ,而是天生质量的回归 。

参考资料:

https://x.com/1jaskiratsingh/status/2000701128431034736?s=20

https://end2end-diffusion.github.io/irepa/

秒追ASI

?点赞、转发、在看一键三连?

点亮星标  ,锁定新智元极速推送!

??时势1:哈尔滨60岁丰满熟女高潮露脸

??12月26日,拎稳“菜篮子” 鼓起“钱袋子”(办实事 解民忧·一线探落实),

  狻猊一双金色的瞳孔很是酷寒  ,全身云烟汹涌  ,像是海啸一样平常  ,且有金色闪电冲起  ,啪的一声击在恶魔猿的后背上 。

,swag在线的 。

??12月26日,西藏亚东出入境边防检查站开展宪法宣传活动,

  “活该  ,叫你们通常不干人事!”

,午夜一级毛片免费播放,差差差不多30分钟滑轮,校花白腿被顶到高潮呻吟 。

??时势2:人妻沦陷2~婬辱の动漫

??12月26日,长三角绿色发展如何谋“新”?民进会员多维度支招,

  “哈哈……好一头鸾鸟  ,竟然是强盛的遗种  ,体内流淌有远古神禽的血  ,真是一种有数的宝药啊  ,看我怎样将它射杀!”一个老人大笑 。

,日本学生妹强奸.性爱区,性插插无码区人妻,99热这里只有精品久久免费 。

??12月26日,12月3日央行以固定利率、数量招标方式开展513亿元逆回购操作,

  各人好:同砚们  ,学业水平考试离我们越来越近了  ,学考决战的军号就要吹响了 。我们全体先生与同砚们的心一起跳动 。再此  ,我作为先生代表  ,想和同砚们谈几个问题 。 第一 要树立信心  ,信心助你乐成

,精品国产国语对白A…V,啪啪熟女富婆,国产一级二级视频在线 。

??时势3:91啪啪福利视频

??12月26日,美方致函台积电对某些复杂芯片实施出口限制 商务部回应,

随着信用卡的普及和使用  ,银行信用卡逾期成为一个普遍保存的问题 。当信用卡逾期抵达一定度时  ,银行接纳上门催收的方法来追讨欠款 。本文将围绕银行信用卡逾期上门睁开讨论  ,探讨银行提前通知、催收流程是什么以及逾期起诉是导致坐牢等问题 。 一、银行信用卡逾期上门提前通知 关于银行信用卡逾期上...

,A级毛片无码免费真,楓ふうあ作品在线观看,最新国产三级片 。

??12月26日,“宝总”终于来了!下一个会是谁?,

  “我会的  ,我是至尊  ,会好起来的 。”小不点轻语 。

,艹逼啊啊啊性逼擦网站,无毛色e,www,欧美精品视频,com 。

??时势4:国产又黄又粗又硬又爽的视频

??12月26日,葛剑雄“回到”图书馆,

#女子吐槽坐高铁被大爷举手机偷拍#高铁是个照妖镜  ,男女都会现真相!今天讲一个大爷偷拍玉人的故事 。8月10日  ,在吉林松原  ,有一位大爷坐在高铁上突然发明有仙女入了世间  ,正好落在身  ,兴致大起 ?烧馕淮笠称ふ站陕员∫恍  ,一直敢直视  ,于是用手机偷拍浏览 。想被玉人发明  ,赶忙关闭摄像头  ,可有没忍住  ,又屏...

,yy4880性巴克,成年人午夜福利视频导航,AⅤ69色 。

??12月26日,11月15日起,粤港澳三地推出3项两地牌车辆管理便利措施,

  他一直的退化  ,体内像是有一个无底洞  ,吞噬其血精  ,化其骨骼  ,人像是只有几个月大了  ,并且不复以前的灵慧了  ,险些快认不身世边的人了 。

,国产日韩AV网站,黄会赢性爱,国产 喷水 粉嫩 91 。

【一系列经济数据不及预期 美国经济衰退担忧重创东京股市】

【百余名设计师创意“龙”形展亮相天津】

责编:林文芳

审核:马尼山

责编:祝科

相关推荐 换一换

Copyright (C) 2001-   dzwww.com. All Rights Reserved

新闻信息效劳允许证 - 音像制品出书允许证 - 广播电视节目制作谋划允许证 - 网络视听允许证 - 网络文化谋划允许证

山东省互联网传媒集团主理  联系电话:0531-85193202  违法不良信息举报电话:0531-85196540

鲁ICP备09023866号-1   鲁公网安备 37010202000111号  

Copyright (C) 2001- Dzwww   鲁ICP备09023866号-1

网站地图