黑色丝袜精品一区二区三区,无论你在哪,都能随时体验高速与便捷的服务

k1体育麻将胡了

搜索 猫眼影戏 融媒体矩阵
  • 山东手机报

  • 猫眼影戏

  • 公共网官方微信

  • 公共网官方微博

  • 抖音

  • 人民号

  • 天下党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

ViT一作盛赞:这其中国开源“PS模子”强过Nano Banana

2026-01-05 05:03:01
泉源:

猫眼影戏

作者:

易容

手机审查

  猫眼影戏记者 刘恩连 报道Q8X2R7L1T4J5M9B6W3

梦瑶 发自 凹非寺量子位 | 公众号 QbitAI

太香了太香了,妥妥完爆ChatGPT和Nano Banana!

刚刚,ViT焦点作者、Meta超等智能团队成员Lucas Beyer连发三条帖子,怒赞通义千问不久前宣布的开源模子Qwen—Image—Layered  。

在他看来,这才是图像天生的准确翻开方法~

他还顺便自补了一句:这个模子偏向自己着实也想做来着,只是太忙,一直没来得及下手……(笑)

真话实说,Qwen—Image—Layered模子确实纷歧般,由于它可以让我们真正实现ps级别的拆图自由  。

也就是说现在图片元素也支持细腻化修改了:

连网友们看了模子效果后都不禁叹息:咋有种开源PhotoShop的感受,amazing啊~

以是,这套让Lucas Beyer重复点赞的模子究竟强在哪儿,咱一起来看!

图片也能像PS一样拆拆拆了

若是说Nano Banana手艺点在生图,那Qwen—Image—Layered模子则厉害在:《拆图》  。

相信各人都有过类似的履历,我们平时用大模子生图时总会碰的到一个抓狂问题,那就是图片天生so easy,细节修改so抓狂  。  。

AI生出来的图片里,经;嵊幸恍┬∠附诓惶轿,但我们又没法只改局部,只能整张丢回模子重新天生,效果往往还不如上一版…

Qwen—Image—Layered模子的焦点能力,就是专治「一图定生死」这事儿的  。

它能将一张通俗图片剖析成多个包括透明度信息的RGBA疏散图层,实现真正意义上的图片素材的可编辑性  。

光说看法有点笼统,咱直接看例子~

在官计划例中,一张完整图片输入之后,模子会自动把画面拆成6个包括差别元素的图层,配景是配景,人物是人物,装饰是装饰,互不滋扰  。

看到这儿各人是不是突然感受,这个很是适适用在海报制作等细节较多的图片上??(雀实

可是Qwen—Image—Layered模子能做的还不止只是疏散图层这么简朴,我们还可以对图层举行二次编辑修改  。

好比最基础的:改配景,不动主体  。

只替换配景图层的颜色,一张橙色配景的海报,瞬间就能换成蓝色版本:

再好比,直接换主体  。

坚持构图稳固,把原图里的长发女孩,换成短发女孩,险些看不出拼接修改痕迹:

再来看下面这个——文字编辑  。

我们可以只修改图片中的局部文字,哪怕第一次天生的文字有幻觉问题也不怕了:

除了基本的替换编辑功效外,Qwen—Image—Layered模子还支持调解元素的巨细、删除不想要的元素等等  。

例如像这样,我们可以删除掉画面中不想要的元素工具,只保存自己想留的画面元素:

又或者在不拉伸、不失真的条件下,轻松调解元素的巨细比例,着实有点像PS里的自由缩放功效:

值得注重的是,Qwen—Image—Layered模子分层不限于牢靠的图层数目,支持可变层剖析,例如我们可以凭证需要将图像剖析为3层或8层:

这个能力很是适合我们在差别的编辑需求场景下使用,可以凭证我们想局部编辑的元素数目多或少而定  。

虽然,若是只是想改文字,差未几两三层就够了,若是修改需求较量多较量重大,多拆几层反而更好操作~

除了适才说的这些,模子还支持在已剖析的图层基础上做进一步剖析,进而实现无限剖析,听上去很像无限套娃…

像下面这位网友,用Qwen—Image—Layered把人物元素举行一次性分层处置惩罚,最后甚至可以一起拆到只剩下一个线稿层:

再来看这位网友,原自己物和配景完全糊在一起的一张图,被模子直接拆成了主体和配景两个自力元素:

简朴说就是:只要画面里不止一个元素,它就能拆、还能一直拆……

拆图的本事来自于扩散模子

有朋侪看到这儿该问了,小小模子背后能有这PS一样平常的能力,用的是啥神奇邪术?

不藏着掖着,Qwen—Image—Layered的焦点手艺,实质上是一套端到端的「扩散模子」  。

它并不是用来天生图片的那种扩散模子,而是专门为「拆图片」这件事设计的——

模子直接输入一张完整的RGB照片,通过扩散历程,一步步展望出多个带透明度信息的RGBA图层  。

这里有一个绕不开的条件是:

我们平时看到的图片着实只有RGB三个通道,但真正的图层编辑,离不开Alpha(透明度)通道  。

为此,Qwen—Image—Layered专门设计了一套四通道的RGBA-VAE,把RGB输入和RGBA输出,统一压缩到统一个隐藏空间中:

详细来说,当输入是一张通俗RGB图片时,模子会自动把Alpha通道补成1(完全不透明),在初始化阶段还会智慧地复用预训练参数,阻止在透明度建模时蜕化  。

这样一来,模子从一最先就「懂透明」,差别图层也就不会被混在一起  。

并且在结构上模子也不是死板拆层,它的焦点Transformer—VLD-MMDiT会凭证图片重漂后,自动决议需要拆成几多层  。

为了阻止前一层把后一层盖住的问题,模子还加了一套Layer3D RoPE(三维位置编码),简朴说就是给差别图层打上明确的层级标签,让模子在空间温顺序上都分得清晰~

还不止云云,在隐藏空间里中,模子能够被逐步「指导」去学会:哪些像素该属于哪一层、哪些区域需要保存透明度、哪些内容应该被疏散开来  。

这样一来哪怕图层再多对模子来说也都是小case了~

并且在训练战略上模子也不是从零教的,而是基于Qwen-Image预训练天生模子逐步升级:

第一阶段让模子学会文本天生单RGBA图层,第二阶段让模子学会扩展到多图层合成,第三阶段让模子真正学会从图片反向拆解多图层  。

每阶段几百K步训练,加上重修损失和感知损失,确保语义疏散清洁、不冗余  。

这样一来利益很直接,以前要领(如LayerD)要递归抠远景再补配景,容易积累过失,或者用支解+修复,遮挡区补欠好  。

Qwen—Image—Layered模子直接实现端到端天生完整RGBA层,阻止这些问题,尤其善于重大遮挡、半透明和文字  。

相较于Nano Banana的“一次抽图定生死”,Qwen—Image—Layered的拆图能力能让Lucas Beyer这么喜欢,也就不希奇了…

现在模子已经开源,感兴趣的朋侪可以试试~

github开源地点:https://github.com/QwenLM/Qwen-Image-Layered

??时势1:silk黑料

??01月05日,中国发布《中国的反恐怖主义法律制度体系与实践》白皮书,

  时间很是紧迫,没有多余的时光可以延误,若是落伍一步大都就会被人捷足先登,所有人都抱着这种心态向前杀去  。

,久久本道久久综合伊人  。

??01月05日,北京严厉打击严重损害建筑市场秩序违法违规行为,

商信用卡逾期3个月怎么协商还款,协商需要什么质料

,国产精视频在线观看,十八禁止黄色网站,亚洲黄片天堂  。

??时势2:欧美淫荡性爱视频

??01月05日,金华第三届全民乒乓联赛举办 全年参赛选手达万余人次,

  这种生物虽然没有在骨骼上结出原始宝符,可是肉身极其强盛,一样很可怖,杀伤力强的惊人,通常狩猎,村人们都在起劲阻止与它们相遇  。

,日韩人妻一区毛片,中文字幕第 页,亚洲图片在线观看  。

??01月05日,重庆新型储能充当“奇兵” 迎战电力保供“烤”验,

  终于,石村近了,小不点抱着红色的犄角,尚有恶魔猿的手臂,心中是满满的幸福,笑的很开心  。

,雪姨受不了了用力,黄色毛片九重紫,学校 拍击 学生 网站  。

??时势3:亚洲熟妇无码八AV在线

??01月05日,菲官员否认中菲就仁爱礁曾达成“新模式”等协议 中方阐明基本事实,

  过了很长时间,柳神才松开,显然它对这头金色的朱厌很在意,不过却没有多说什么  。

,十大黄直播免费版官方版下载,尤物视频精品一区,欧美乱色激情综合网,欧美性爱直播一区二区,我...,精品国产久九九  。

??01月05日,贷款金额超1.54亿元 邮储银行支持以旧换新 “焕”出消费新活力,

  这次军训室外训练10天,整理内务半天,旅行和讲座3天  。休整2天  ?怠⒔嵋盗1天  。

,涩图本子18,亚洲专区亚洲专区38页,亚洲激情婷婷五月天  。

??时势4:黄色在线观看视频网站

??01月05日,中国大熊猫“香香”生日会在东京举办,

  这是他的生气,恐怖无比,自然溢出,犹如一个大火炉,又像是一尊紫光耀眼的神祇,令人不敢靠近,只能瞻仰  。

,18岁免费看的黄片,大雷和大狙30分钟正片,推荐一个黄色视频在线  。

??01月05日,财政部:利比里亚共和国籍的应税船舶适用船舶吨税优惠税率,

  相信通过我们各人的配合起劲,我校一定会成为社会羡慕、家长定心、师生协调生长的乐园  。

,A片全部能看的网址,无码黄片视频,十大黄台 软  。

【U16国足被韩国队逼平,小组赛三胜一平】

【(文化中国行)流动的“史诗” 扬州中国大运河博物馆讲述千年历史文化 】

责编:阿什福德

审核:高华林

责编:郑美香

相关推荐 换一换

Copyright (C) 2001-   dzwww.com. All Rights Reserved

新闻信息效劳允许证 - 音像制品出书允许证 - 广播电视节目制作谋划允许证 - 网络视听允许证 - 网络文化谋划允许证

山东省互联网传媒集团主理  联系电话:0531-85193202  违法不良信息举报电话:0531-85196540

鲁ICP备09023866号-1   鲁公网安备 37010202000111号  

Copyright (C) 2001- Dzwww   鲁ICP备09023866号-1

网站地图