(10分钟深度分析)超级碰人人操人人鸿蒙版v28.53.23.93.20.151.22.99-2265安卓网

k1体育麻将胡了

搜索 猫眼影戏 融媒体矩阵
  • 山东手机报

  • 猫眼影戏

  • 公共网官方微信

  • 公共网官方微博

  • 抖音

  • 人民号

  • 天下党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

ViT一作盛赞:这其中国开源“PS模子”强过Nano Banana

2026-01-03 13:15:35
泉源:

猫眼影戏

作者:

窦灵

手机审查

  猫眼影戏记者 于咏琳 报道Q8X2R7L1T4J5M9B6W3

梦瑶 发自 凹非寺量子位 | 公众号 QbitAI

太香了太香了 ,妥妥完爆ChatGPT和Nano Banana!

刚刚 ,ViT焦点作者、Meta超等智能团队成员Lucas Beyer连发三条帖子 ,怒赞通义千问不久前宣布的开源模子Qwen—Image—Layered。

在他看来 ,这才是图像天生的准确翻开方法~

他还顺便自补了一句:这个模子偏向自己着实也想做来着 ,只是太忙 ,一直没来得及下手……(笑)

真话实说 ,Qwen—Image—Layered模子确实纷歧般 ,由于它可以让我们真正实现ps级别的拆图自由。

也就是说现在图片元素也支持细腻化修改了:

连网友们看了模子效果后都不禁叹息:咋有种开源PhotoShop的感受 ,amazing啊~

以是 ,这套让Lucas Beyer重复点赞的模子究竟强在哪儿 ,咱一起来看!

图片也能像PS一样拆拆拆了

若是说Nano Banana手艺点在生图 ,那Qwen—Image—Layered模子则厉害在:《拆图》。

相信各人都有过类似的履历 ,我们平时用大模子生图时总会碰的到一个抓狂问题 ,那就是图片天生so easy ,细节修改so抓狂。。

AI生出来的图片里 ,经;嵊幸恍┬∠附诓惶轿 ,但我们又没法只改局部 ,只能整张丢回模子重新天生 ,效果往往还不如上一版…

Qwen—Image—Layered模子的焦点能力 ,就是专治「一图定生死」这事儿的。

它能将一张通俗图片剖析成多个包括透明度信息的RGBA疏散图层 ,实现真正意义上的图片素材的可编辑性。

光说看法有点笼统 ,咱直接看例子~

在官计划例中 ,一张完整图片输入之后 ,模子会自动把画面拆成6个包括差别元素的图层 ,配景是配景 ,人物是人物 ,装饰是装饰 ,互不滋扰。

看到这儿各人是不是突然感受 ,这个很是适适用在海报制作等细节较多的图片上??(雀实

可是Qwen—Image—Layered模子能做的还不止只是疏散图层这么简朴 ,我们还可以对图层举行二次编辑修改。

好比最基础的:改配景 ,不动主体。

只替换配景图层的颜色 ,一张橙色配景的海报 ,瞬间就能换成蓝色版本:

再好比 ,直接换主体。

坚持构图稳固 ,把原图里的长发女孩 ,换成短发女孩 ,险些看不出拼接修改痕迹:

再来看下面这个——文字编辑。

我们可以只修改图片中的局部文字 ,哪怕第一次天生的文字有幻觉问题也不怕了:

除了基本的替换编辑功效外 ,Qwen—Image—Layered模子还支持调解元素的巨细、删除不想要的元素等等。

例如像这样 ,我们可以删除掉画面中不想要的元素工具 ,只保存自己想留的画面元素:

又或者在不拉伸、不失真的条件下 ,轻松调解元素的巨细比例 ,着实有点像PS里的自由缩放功效:

值得注重的是 ,Qwen—Image—Layered模子分层不限于牢靠的图层数目 ,支持可变层剖析 ,例如我们可以凭证需要将图像剖析为3层或8层:

这个能力很是适合我们在差别的编辑需求场景下使用 ,可以凭证我们想局部编辑的元素数目多或少而定。

虽然 ,若是只是想改文字 ,差未几两三层就够了 ,若是修改需求较量多较量重大 ,多拆几层反而更好操作~

除了适才说的这些 ,模子还支持在已剖析的图层基础上做进一步剖析 ,进而实现无限剖析 ,听上去很像无限套娃…

像下面这位网友 ,用Qwen—Image—Layered把人物元素举行一次性分层处置惩罚 ,最后甚至可以一起拆到只剩下一个线稿层:

再来看这位网友 ,原自己物和配景完全糊在一起的一张图 ,被模子直接拆成了主体和配景两个自力元素:

简朴说就是:只要画面里不止一个元素 ,它就能拆、还能一直拆……

拆图的本事来自于扩散模子

有朋侪看到这儿该问了 ,小小模子背后能有这PS一样平常的能力 ,用的是啥神奇邪术?

不藏着掖着 ,Qwen—Image—Layered的焦点手艺 ,实质上是一套端到端的「扩散模子」。

它并不是用来天生图片的那种扩散模子 ,而是专门为「拆图片」这件事设计的——

模子直接输入一张完整的RGB照片 ,通过扩散历程 ,一步步展望出多个带透明度信息的RGBA图层。

这里有一个绕不开的条件是:

我们平时看到的图片着实只有RGB三个通道 ,但真正的图层编辑 ,离不开Alpha(透明度)通道。

为此 ,Qwen—Image—Layered专门设计了一套四通道的RGBA-VAE ,把RGB输入和RGBA输出 ,统一压缩到统一个隐藏空间中:

详细来说 ,当输入是一张通俗RGB图片时 ,模子会自动把Alpha通道补成1(完全不透明) ,在初始化阶段还会智慧地复用预训练参数 ,阻止在透明度建模时蜕化。

这样一来 ,模子从一最先就「懂透明」 ,差别图层也就不会被混在一起。

并且在结构上模子也不是死板拆层 ,它的焦点Transformer—VLD-MMDiT会凭证图片重漂后 ,自动决议需要拆成几多层。

为了阻止前一层把后一层盖住的问题 ,模子还加了一套Layer3D RoPE(三维位置编码) ,简朴说就是给差别图层打上明确的层级标签 ,让模子在空间温顺序上都分得清晰~

还不止云云 ,在隐藏空间里中 ,模子能够被逐步「指导」去学会:哪些像素该属于哪一层、哪些区域需要保存透明度、哪些内容应该被疏散开来。

这样一来哪怕图层再多对模子来说也都是小case了~

并且在训练战略上模子也不是从零教的 ,而是基于Qwen-Image预训练天生模子逐步升级:

第一阶段让模子学会文本天生单RGBA图层 ,第二阶段让模子学会扩展到多图层合成 ,第三阶段让模子真正学会从图片反向拆解多图层。

每阶段几百K步训练 ,加上重修损失和感知损失 ,确保语义疏散清洁、不冗余。

这样一来利益很直接 ,以前要领(如LayerD)要递归抠远景再补配景 ,容易积累过失 ,或者用支解+修复 ,遮挡区补欠好。

Qwen—Image—Layered模子直接实现端到端天生完整RGBA层 ,阻止这些问题 ,尤其善于重大遮挡、半透明和文字。

相较于Nano Banana的“一次抽图定生死” ,Qwen—Image—Layered的拆图能力能让Lucas Beyer这么喜欢 ,也就不希奇了…

现在模子已经开源 ,感兴趣的朋侪可以试试~

github开源地点:https://github.com/QwenLM/Qwen-Image-Layered

??时势1:jjzz污网站

??01月03日,“十四冬”单板滑雪平行大回转比赛首金诞生,

  “这里离石村很近 ,族长爷爷他们一定会听到新闻来接应我们。”小石昊说道。

,AV网址aaa。

??01月03日,国产机器人准确答出2022年世界杯冠军得主 外国驻华使节拍手叫好,

  一名战将上前 ,抽出一柄利刃 ,直接向前扫去。

,泡在我家的黑田同学动漫第一集免费观看,一级影院,流萤被操。

??时势2:又爽又色高潮视频国产网站

??01月03日,卖国者,虽远必究!6名在逃“港独”分子被撤销护照,

  而此时石昊身在半空中 ,正好迎向前方 ,很难逃避 ,看的石村中的人心都差点跳出来 ,全都对狈风暗恨不已 ,由于他脱手很是狠毒。

,亚洲AA日韩AA欧美DDD,www.毛片基地,美女色色色色色网。

??01月03日,百位专家将合力编撰《特应性皮炎365问》,

  “吱吱……”拳头大的金色朱厌上串下跳 ,很是担心 ,一双灵动的大眼瞪的溜圆 ,发出尖锐的啼声 ,恨不得连忙夺到手中 ,它看到这块骨后 ,很是担心与焦躁。

,无尽 大胸 动漫 警花,欧美日韩在线精品播放视频,欧美国产日韩黄色录像。

??时势3:成人午夜电影,A片

??01月03日,付费面试辅导服务真的靠谱吗?,

  列位团干 ,各人好!

,免费一级A片淫片AA,第一视频区亚洲日韩,免费在线黄色网站日本。

??01月03日,“哆啦A梦儿童图画书”系列上市 纪念哆啦A梦出版50周年,

  “小哥哥 ,好厉害啊 ,以后要好好教教我。”清风大眼发光 ,近乎敬重。

,A片免费视频性生活,国产精品视频98,女性生殖器官图小妹妹。

??时势4:女仆扒开腿秘 让人侵犯

??01月03日,面对AI,巴菲特为何“投资理念不会有任何改变”,

  这里的生齿不是许多 ,为一个古老的隐世家族 ,但其传承却恐怖的惊人 ,在上古年月曾君临过这片大地。

,人禽交 欧美 网站,操控插B,集芳阁成人一区。

??01月03日,逾750名海内外龙舟运动员齐聚广州白云上演“速度与激情”,

  柳树早已折断许多年 ,剩余一截焦黑的主干 ,直径足有十几米 ,仅有一条柳枝 ,青翠欲滴 ,随风摇曳。

,国产精品主播在线,法国做爰XXXⅩ性派对,亚洲综合激情图。

责编:圣雄甘地

审核:程丽娜

责编:刘展

相关推荐 换一换

Copyright (C) 2001-   dzwww.com. All Rights Reserved

新闻信息效劳允许证 - 音像制品出书允许证 - 广播电视节目制作谋划允许证 - 网络视听允许证 - 网络文化谋划允许证

山东省互联网传媒集团主理  联系电话:0531-85193202  违法不良信息举报电话:0531-85196540

鲁ICP备09023866号-1   鲁公网安备 37010202000111号  

Copyright (C) 2001- Dzwww   鲁ICP备09023866号-1

网站地图