首页
梦瑶 发自 凹非寺量子位 | 公众号 QbitAI
太香了太香了,妥妥完爆ChatGPT和Nano Banana!
刚刚,ViT焦点作者、Meta超等智能团队成员Lucas Beyer连发三条帖子,怒赞通义千问不久前宣布的开源模子Qwen—Image—Layered。
在他看来,这才是图像天生的准确翻开方法~
他还顺便自补了一句:这个模子偏向自己着实也想做来着,只是太忙,一直没来得及下手……(笑)
真话实说,Qwen—Image—Layered模子确实纷歧般,由于它可以让我们真正实现ps级别的拆图自由。
也就是说现在图片元素也支持细腻化修改了:
连网友们看了模子效果后都不禁叹息:咋有种开源PhotoShop的感受,amazing啊~
以是,这套让Lucas Beyer重复点赞的模子究竟强在哪儿,咱一起来看!
图片也能像PS一样拆拆拆了
若是说Nano Banana手艺点在生图,那Qwen—Image—Layered模子则厉害在:《拆图》。
相信各人都有过类似的履历,我们平时用大模子生图时总会碰的到一个抓狂问题,那就是图片天生so easy,细节修改so抓狂。。
AI生出来的图片里,经;嵊幸恍┬∠附诓惶轿,但我们又没法只改局部,只能整张丢回模子重新天生,效果往往还不如上一版…
Qwen—Image—Layered模子的焦点能力,就是专治「一图定生死」这事儿的。
它能将一张通俗图片剖析成多个包括透明度信息的RGBA疏散图层,实现真正意义上的图片素材的可编辑性。
光说看法有点笼统,咱直接看例子~
在官计划例中,一张完整图片输入之后,模子会自动把画面拆成6个包括差别元素的图层,配景是配景,人物是人物,装饰是装饰,互不滋扰。
看到这儿各人是不是突然感受,这个很是适适用在海报制作等细节较多的图片上??(雀实
可是Qwen—Image—Layered模子能做的还不止只是疏散图层这么简朴,我们还可以对图层举行二次编辑修改。
好比最基础的:改配景,不动主体。
只替换配景图层的颜色,一张橙色配景的海报,瞬间就能换成蓝色版本:
再好比,直接换主体。
坚持构图稳固,把原图里的长发女孩,换成短发女孩,险些看不出拼接修改痕迹:
再来看下面这个——文字编辑。
我们可以只修改图片中的局部文字,哪怕第一次天生的文字有幻觉问题也不怕了:
除了基本的替换编辑功效外,Qwen—Image—Layered模子还支持调解元素的巨细、删除不想要的元素等等。
例如像这样,我们可以删除掉画面中不想要的元素工具,只保存自己想留的画面元素:
又或者在不拉伸、不失真的条件下,轻松调解元素的巨细比例,着实有点像PS里的自由缩放功效:
值得注重的是,Qwen—Image—Layered模子分层不限于牢靠的图层数目,支持可变层剖析,例如我们可以凭证需要将图像剖析为3层或8层:
这个能力很是适合我们在差别的编辑需求场景下使用,可以凭证我们想局部编辑的元素数目多或少而定。
虽然,若是只是想改文字,差未几两三层就够了,若是修改需求较量多较量重大,多拆几层反而更好操作~
除了适才说的这些,模子还支持在已剖析的图层基础上做进一步剖析,进而实现无限剖析,听上去很像无限套娃…
像下面这位网友,用Qwen—Image—Layered把人物元素举行一次性分层处置惩罚,最后甚至可以一起拆到只剩下一个线稿层:
再来看这位网友,原自己物和配景完全糊在一起的一张图,被模子直接拆成了主体和配景两个自力元素:
简朴说就是:只要画面里不止一个元素,它就能拆、还能一直拆……
拆图的本事来自于扩散模子
有朋侪看到这儿该问了,小小模子背后能有这PS一样平常的能力,用的是啥神奇邪术?
不藏着掖着,Qwen—Image—Layered的焦点手艺,实质上是一套端到端的「扩散模子」。
它并不是用来天生图片的那种扩散模子,而是专门为「拆图片」这件事设计的——
模子直接输入一张完整的RGB照片,通过扩散历程,一步步展望出多个带透明度信息的RGBA图层。
这里有一个绕不开的条件是:
我们平时看到的图片着实只有RGB三个通道,但真正的图层编辑,离不开Alpha(透明度)通道。
为此,Qwen—Image—Layered专门设计了一套四通道的RGBA-VAE,把RGB输入和RGBA输出,统一压缩到统一个隐藏空间中:
详细来说,当输入是一张通俗RGB图片时,模子会自动把Alpha通道补成1(完全不透明),在初始化阶段还会智慧地复用预训练参数,阻止在透明度建模时蜕化。
这样一来,模子从一最先就「懂透明」,差别图层也就不会被混在一起。
并且在结构上模子也不是死板拆层,它的焦点Transformer—VLD-MMDiT会凭证图片重漂后,自动决议需要拆成几多层。
为了阻止前一层把后一层盖住的问题,模子还加了一套Layer3D RoPE(三维位置编码),简朴说就是给差别图层打上明确的层级标签,让模子在空间温顺序上都分得清晰~
还不止云云,在隐藏空间里中,模子能够被逐步「指导」去学会:哪些像素该属于哪一层、哪些区域需要保存透明度、哪些内容应该被疏散开来。
这样一来哪怕图层再多对模子来说也都是小case了~
并且在训练战略上模子也不是从零教的,而是基于Qwen-Image预训练天生模子逐步升级:
第一阶段让模子学会文本天生单RGBA图层,第二阶段让模子学会扩展到多图层合成,第三阶段让模子真正学会从图片反向拆解多图层。
每阶段几百K步训练,加上重修损失和感知损失,确保语义疏散清洁、不冗余。
这样一来利益很直接,以前要领(如LayerD)要递归抠远景再补配景,容易积累过失,或者用支解+修复,遮挡区补欠好。
Qwen—Image—Layered模子直接实现端到端天生完整RGBA层,阻止这些问题,尤其善于重大遮挡、半透明和文字。
相较于Nano Banana的“一次抽图定生死”,Qwen—Image—Layered的拆图能力能让Lucas Beyer这么喜欢,也就不希奇了…
现在模子已经开源,感兴趣的朋侪可以试试~
github开源地点:https://github.com/QwenLM/Qwen-Image-Layered
《av天堂2》,《Q8X2R7L1T4J5M9B6W3》午夜看片网
“影音先锋亚洲色资源网站”
国产3p一区二区三区视频在线
……
01月04日
“国产一级性爱A片”驯鹿宝贝
↓↓↓
01月04日,(文化中国行)别样江南 常州焦溪古镇为何是“黄石半墙”?,在五十路熟妇高熟无码,原神黄漫本子,WWWMMM日本,人人草网站
01月04日,(巴黎残奥会)探访巴黎残奥村:奥运村的完美“转身”,国产一级AV在线播放免费,18+羞羞爆乳,色综合色综合色综合,欧美激情第5欧美精品
01月04日,“五一”旅游大数据:中国旅游市场延续火爆态势,美女洗澡秘 免费看,PORNO馃崜18100,国产日韩欧美精品,免费福利在线看黄网站
01月04日|日媒:香港国泰航空客机与大韩航空客机在日本北海道机场相撞|免费黄色网站AA片A|日本50岁丰满熟妇XXXX|色欲特级毛片免费看|雏田本子h全彩无码
01月04日|郑州迎2024年首场降雪 民众打卡拍照|久久久精品A片免费观看|两人一起搓搓拔萝卜视频|丝袜性爱视频|超碰 白浆 国产
01月04日|三部门:紧急调拨中央救灾物资支持新疆乌什县做好抗震救灾工作|亚洲va优物中文字|欧洲一区二区三区自拍天堂|美女毛逼做爱|欧美疯狂做受XXXX……
01月04日,重庆遭遇大雾天气 城市建筑若隐若现,做爰 高潮,腐书父子调教打屁股真人视频,车文道具,客厅乱插丰满丝袜人妻
01月04日,陕西省气象台发布大雾黄色预警信号,国产在线操大学生,扒开老女毛荫荫的黑森林视频,被,影音先锋一区二区三区
01月04日|交通运输部:10月21日-10月27日全国货运物流有序运行|国产黄色一级换妻视:|欧美成aⅴ人高清免费观看91|人人摸人人操人人看人人|白丝自慰app
01月04日,HICOOL全球创业者峰会上的黑科技,中文字幕彩旬,国产精品一级网址,免费久久黄色网站,黄色视频白色
01月04日,湛江海关首次查获液态洋垃圾 总重近20吨,国产永久免费精品999,久久99草,偷窥激情日韩,欧美最爱视频在线观看免费
01月04日,海口打造“演艺之城”拉动消费,爽好大用力使劲插快点使劲搞好粗,色综合久久久久久久综合,玛奇玛被操,国产真实迷JIAN系列合集33
01月04日|“碳”路先行|山东港口青岛港如何“氢”装上阵?|重口三级小视频在线免费观看|欧美精品人人做人人爱视频|97超色自拍|女人露双乳无套视频91
01月04日|巴西里约热内卢强降雨已造成7人死亡|17·c_om起草|78ia鈥唙|黄色插插视频|白丝粉嫩玉足夹精脚交
01月04日|学者解读台湾选举:大陆绝不会给“台独”分裂势力留下任何空间和机会|168黄色网站|无码色Av一区二区在线观看|www.一级com看片|女教师办公室色情毛片
如果岁月可回头,请回答1988|中共中央政治局召开会议 审议《关于二十届中央第三轮巡视情况的综合报告》 中共中央总书记习近平主持会议|91免费看三级片|五月天婷婷色综合|欧洲熟妇av无码|无码黄片.com
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺

闽公网安备 35010302000113号