首页
梦瑶 发自 凹非寺量子位 | 公众号 QbitAI
太香了太香了,妥妥完爆ChatGPT和Nano Banana!
刚刚,ViT焦点作者、Meta超等智能团队成员Lucas Beyer连发三条帖子,怒赞通义千问不久前宣布的开源模子Qwen—Image—Layered。
在他看来,这才是图像天生的准确翻开方法~
他还顺便自补了一句:这个模子偏向自己着实也想做来着,只是太忙,一直没来得及下手……(笑)
真话实说,Qwen—Image—Layered模子确实纷歧般,由于它可以让我们真正实现ps级别的拆图自由。
也就是说现在图片元素也支持细腻化修改了:
连网友们看了模子效果后都不禁叹息:咋有种开源PhotoShop的感受,amazing啊~
以是,这套让Lucas Beyer重复点赞的模子究竟强在哪儿,咱一起来看!
图片也能像PS一样拆拆拆了
若是说Nano Banana手艺点在生图,那Qwen—Image—Layered模子则厉害在:《拆图》。
相信各人都有过类似的履历,我们平时用大模子生图时总会碰的到一个抓狂问题,那就是图片天生so easy,细节修改so抓狂。。
AI生出来的图片里,经;嵊幸恍┬∠附诓惶轿,但我们又没法只改局部,只能整张丢回模子重新天生,效果往往还不如上一版…
Qwen—Image—Layered模子的焦点能力,就是专治「一图定生死」这事儿的。
它能将一张通俗图片剖析成多个包括透明度信息的RGBA疏散图层,实现真正意义上的图片素材的可编辑性。
光说看法有点笼统,咱直接看例子~
在官计划例中,一张完整图片输入之后,模子会自动把画面拆成6个包括差别元素的图层,配景是配景,人物是人物,装饰是装饰,互不滋扰。
看到这儿各人是不是突然感受,这个很是适适用在海报制作等细节较多的图片上??(雀实
可是Qwen—Image—Layered模子能做的还不止只是疏散图层这么简朴,我们还可以对图层举行二次编辑修改。
好比最基础的:改配景,不动主体。
只替换配景图层的颜色,一张橙色配景的海报,瞬间就能换成蓝色版本:
再好比,直接换主体。
坚持构图稳固,把原图里的长发女孩,换成短发女孩,险些看不出拼接修改痕迹:
再来看下面这个——文字编辑。
我们可以只修改图片中的局部文字,哪怕第一次天生的文字有幻觉问题也不怕了:
除了基本的替换编辑功效外,Qwen—Image—Layered模子还支持调解元素的巨细、删除不想要的元素等等。
例如像这样,我们可以删除掉画面中不想要的元素工具,只保存自己想留的画面元素:
又或者在不拉伸、不失真的条件下,轻松调解元素的巨细比例,着实有点像PS里的自由缩放功效:
值得注重的是,Qwen—Image—Layered模子分层不限于牢靠的图层数目,支持可变层剖析,例如我们可以凭证需要将图像剖析为3层或8层:
这个能力很是适合我们在差别的编辑需求场景下使用,可以凭证我们想局部编辑的元素数目多或少而定。
虽然,若是只是想改文字,差未几两三层就够了,若是修改需求较量多较量重大,多拆几层反而更好操作~
除了适才说的这些,模子还支持在已剖析的图层基础上做进一步剖析,进而实现无限剖析,听上去很像无限套娃…
像下面这位网友,用Qwen—Image—Layered把人物元素举行一次性分层处置惩罚,最后甚至可以一起拆到只剩下一个线稿层:
再来看这位网友,原自己物和配景完全糊在一起的一张图,被模子直接拆成了主体和配景两个自力元素:
简朴说就是:只要画面里不止一个元素,它就能拆、还能一直拆……
拆图的本事来自于扩散模子
有朋侪看到这儿该问了,小小模子背后能有这PS一样平常的能力,用的是啥神奇邪术?
不藏着掖着,Qwen—Image—Layered的焦点手艺,实质上是一套端到端的「扩散模子」。
它并不是用来天生图片的那种扩散模子,而是专门为「拆图片」这件事设计的——
模子直接输入一张完整的RGB照片,通过扩散历程,一步步展望出多个带透明度信息的RGBA图层。
这里有一个绕不开的条件是:
我们平时看到的图片着实只有RGB三个通道,但真正的图层编辑,离不开Alpha(透明度)通道。
为此,Qwen—Image—Layered专门设计了一套四通道的RGBA-VAE,把RGB输入和RGBA输出,统一压缩到统一个隐藏空间中:
详细来说,当输入是一张通俗RGB图片时,模子会自动把Alpha通道补成1(完全不透明),在初始化阶段还会智慧地复用预训练参数,阻止在透明度建模时蜕化。
这样一来,模子从一最先就「懂透明」,差别图层也就不会被混在一起。
并且在结构上模子也不是死板拆层,它的焦点Transformer—VLD-MMDiT会凭证图片重漂后,自动决议需要拆成几多层。
为了阻止前一层把后一层盖住的问题,模子还加了一套Layer3D RoPE(三维位置编码),简朴说就是给差别图层打上明确的层级标签,让模子在空间温顺序上都分得清晰~
还不止云云,在隐藏空间里中,模子能够被逐步「指导」去学会:哪些像素该属于哪一层、哪些区域需要保存透明度、哪些内容应该被疏散开来。
这样一来哪怕图层再多对模子来说也都是小case了~
并且在训练战略上模子也不是从零教的,而是基于Qwen-Image预训练天生模子逐步升级:
第一阶段让模子学会文本天生单RGBA图层,第二阶段让模子学会扩展到多图层合成,第三阶段让模子真正学会从图片反向拆解多图层。
每阶段几百K步训练,加上重修损失和感知损失,确保语义疏散清洁、不冗余。
这样一来利益很直接,以前要领(如LayerD)要递归抠远景再补配景,容易积累过失,或者用支解+修复,遮挡区补欠好。
Qwen—Image—Layered模子直接实现端到端天生完整RGBA层,阻止这些问题,尤其善于重大遮挡、半透明和文字。
相较于Nano Banana的“一次抽图定生死”,Qwen—Image—Layered的拆图能力能让Lucas Beyer这么喜欢,也就不希奇了…
现在模子已经开源,感兴趣的朋侪可以试试~
github开源地点:https://github.com/QwenLM/Qwen-Image-Layered
《色哟哟韩国精品欧美精品》,《Q8X2R7L1T4J5M9B6W3》色综合图开心婷婷五月
“隐私视频随便看免费隐私视频随便看免费”
2020国产精品自拍
……
01月05日
“精品国产专区91在线尤物”航展上一架“肥机”慢悠悠飘过
↓↓↓
01月05日,2024全国服务消费季暨上海服务消费“+”年华盛大开启,国产会所嫖妓视频在线,亚洲 日韩 色 图网站最新,亚洲Aⅴ天堂Av天堂无码久久,又黄又爽又色又刺激的视频
01月05日,深江铁路施工现场发生坍塌 13名现场作业人员失联,爱情岛亚洲福利网站在线观看,羞羞漫画 观看入口2023,国产精品门国产三级国快看,老师❌开腿让我爽一夜动漫
01月05日,贵州省政协十三届二次会议开幕,欧美69xxxx,97人妻操,91国内自拍露脸,三级无码免费
01月05日|青海撒拉尔之乡:航拍油菜梯田花开如画|黄色的网站|欧美精品一级在线观看片|欧美AAAAAAAAAAAA|嗯~啊~快点 死我雏田网站
01月05日|广东省人大常委会原副主任陈如桂一审被判无期徒刑|操黄操骚妇B视频|日本红怡红院|艾莉同学被艹到高潮的视频|福利姬私人玩物
01月05日|“琴澳旅游团”首发团抵达澳门|女性向 skii|欧美狠狠入鲁|九九视频精品免费|黄片视频啊啊啊啊啊啊啊啊……
01月05日,李强抵达惠灵顿开始对新西兰进行正式访问,黄色视频在线观看色,猛男GayGayS 免费视频,三级片国产黄色视频,欧美日韩精品二区
01月05日,第二届海峡两岸(福州)人工智能-工业机器人竞赛举行,日韩欧美激情A∨一区二区,黄视频日本,色精品精品精品,男生和女生在一起差差的很痛开车
01月05日|“相机人”张义:将游客身影定格在“尔滨”|禁 秘 日韩|9.1网站免费登录官方版下载|强奷漂亮的女教师中文字幕q|美女视频黄2020
01月05日,4月22日人民币对美元中间价报7.1043元 上调3个基点,国产宾馆自拍,性直播18无遮挡高清免费,伊人大香线蕉精品在线观看99,中文字幕国产欧美日韩成年人看片
01月05日,截至2023年底,天津经开区拥有外资项目6478个,国产福利小小视频在线观看,芙宁娜调教成yin荡玩物,欧美特级黄色A片,国产精品亚欧美一区二区
01月05日,“五一”消费火热,假日经济活力尽显,亚洲高清偷拍一区二区三区,免费观看黄A片免费网站免费,性插视频天天干,国内拍自拍偷自拍视频2022
01月05日|西藏出入境边防检查总站深入基层艰苦偏远单位开展主题实践活动|性爱无码一级片|妈妈鼓蓬蓬的牦户图片|口工实验室官网|无码AV永久免费专区久久
01月05日|黑龙江哈尔滨:向日葵花海盛开 引众多游客观赏|sxx日本|猎户开户软件|www.黄色.com视频网站|日韩精品视频无播放器在线观看免费
01月05日|广西梧州:百年骑楼城亮灯 喜迎八方来客|亚洲 丝袜 制服 欧美 另类|日本视频wwww|亚洲视频在线最新|台湾二级艳片在线观看播放
这些“宝”总书记叮嘱要呵护好,免责声明|六小龄童谈绍剧传承:年轻人要接过“金箍棒”|蝴蝶忍被C上天|人人操人人看人人干|亚洲天堂网视频在线|欧美色欧美亚洲另类一区二区三区
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺

闽公网安备 35010302000113号