v8.725.2696 安卓最新版
v5.367.8491.908966 IOS版
v5.965.1851.774217 PC版
v3.643.2914.781823 安卓最新版
v4.72.5847.258980 最新版
v9.867 安卓免費版
v5.593.3789.855219 安卓漢化版
v2.161.9867.288009 安卓漢化版
v6.649.9345.593299 安卓版
v6.228.4564 安卓版
v6.598.4865.573198 最新版
v4.964.902 安卓免費版
v6.834 IOS版
v6.618.327 安卓漢化版
v8.100.4829.229871 安卓免費版
v9.476.3924 安卓免費版
v7.172 安卓漢化版
v6.353.2467.651348 安卓免費版
v2.689 PC版
v5.816.2677.721043 安卓漢化版
v8.874 IOS版
v5.527.1682.857622 安卓版
v7.609.6186.652797 IOS版
v3.906.3852.883792 IOS版
v4.482.3104.219741 安卓漢化版
v1.741 IOS版
v1.745.8855.875273 PC版
v9.749 最新版
v7.71.5614.81508 安卓漢化版
v2.293 安卓免費版
v3.668.1014 最新版
v9.332.6536 安卓免費版
v2.715.4631 安卓版
v4.450 安卓漢化版
v8.553 安卓最新版
v4.945.3136 IOS版
v6.285 安卓版
v5.768 安卓漢化版
v3.504.3818.840796 最新版
v6.500.9954 PC版
v1.122.725 安卓漢化版
v1.998.90.105057 安卓漢化版
v5.291.8292.420778 最新版
v9.707.591 最新版
v8.641.6275.380377 PC版
v5.223.6101.647549 最新版
v5.244 PC版
v2.687 安卓漢化版
v1.918 PC版
v9.327.1217.927234 最新版
v6.357.7314.765288 IOS版
v3.322 安卓漢化版
v5.573.8540.580286 IOS版
v3.167 安卓免費版
v1.488.9748.707925 安卓版
v1.378.2011.831439 IOS版
v1.918.5154 安卓漢化版
v3.654.1202 最新版
v7.538.701.990950 安卓版
v5.87 PC版
v3.859.7188 安卓版
v1.852 安卓免費版
v1.578.9983 安卓漢化版
v2.751.43.833596 最新版
v8.78.6101.668359 IOS版
v7.665.3207 IOS版
v9.662.3371 安卓免費版
v8.541.782.974613 IOS版
v4.44.5798 安卓漢化版
v5.550.3062.970751 安卓最新版
v9.281.5802.748281 安卓最新版
v4.826.393.211638 PC版
v2.775.5597 安卓最新版
v3.818.9500.508254 PC版
v9.579.5503.797751 安卓漢化版
v1.273.2171.125232 安卓最新版
v6.693.5248 安卓版
v8.519.7744.804648 安卓版
v9.714 安卓免費版
v8.254.3167.298415 安卓免費版
在线H视频
只管近年来AIGC要害手艺一直突破,但图像天生领域始终面临着一个“两难逆境”:闭源模子性能强盛但难以私有化安排;开源计划在轻量化与高性能之间难以取舍,且缺乏面向商用的专项能力。
针对这一行业痛点,美团LongCat团队克日宣布,开源其最新研发的LongCat-Image模子。该模子通过高性能模子架构设计、系统性的训练战略和数据工程,以6B的紧凑参数规模,在文生图与图像编辑焦点能力上迫近了更大尺寸的头部模子,为开发者与工业界提供了一个“高性能、低门槛、全开放”的全新选择。
▲模子架构
据先容,LongCat-Image的焦点优势在于其架构设计与训练战略。
详细来看,模子接纳文生图与图像编辑同源的架构,连系渐进式学习战略,乐成在6B参数下实现了指令遵照精准度、生图质量与文字渲染能力的高效协同。
在图像编辑方面,LongCat-Image的“可控性”体现突出,而性能突破的要害在于一套细密协同的训练范式和数据战略。
为有用继续文生图模子的知识和美感,同时阻止文生图后训练阶段收窄的状态空间对编辑指令多样性的限制,团队一方面基于文生图Mid-training阶段模子举行初始化,并接纳指令编辑与文生图多使命联合学习机制,深化对重大多样化指令的明确;另一方面,通过预训练阶段的多源数据及指令改写战略,以及连系SFT阶段引入的人工精标数据,最终实现了指令遵照精准度、泛化性和编辑前后视觉一致性的配合提升。
在GEdit-Bench和ImgEdit-Bench等权威基准测试中,LongCat-Image均抵达开源SOTA(目今最佳)水平,可精准响应用户的多样化修改需求。
在中文文本渲染这一恒久困扰业界的难题上,LongCat-Image也取得了很大希望,通过课程学习战略提升字符笼罩度和渲染精准度:预训练阶段基于万万量级合成数据学习字形,笼罩通用规范汉字表的8105个汉字;SFT 阶段引入真实天下文本图像数据,提升在字体、排版结构上的泛化能力;在RL(强化学习)阶段,引入OCR与美学双奖励模子,进一步提升文本准确性与配景融合自然度。
该模子在ChineseWord评测中以90.7的得分领先同类产品。无论是商业海报中的重大笔画,照旧古诗词插图中的生僻字,LongCat-Image均能实现精准、自然的渲染,进一步拓展AI在设计领域的应用界线。
为了提升天生图像的审美与真实感,LongCat团队还构建了系统性的数据筛选与对抗训练框架。团队在预训练阶段严酷过滤低质量AIGC数据,并在RL阶段立异性引入AIGC内容检测器作为奖励模子,使用其对抗信号逆向指导模子学习真实天下的物理纹理、光影和质感,从而显著改善了AI绘图常见的“塑料感”纹理。
▲客观基准测试性能比照
周全的客观与主观评测数据均验证了LongCat-Image的能力:在客观基准测试中,其图像编辑得分与中文渲染能力均领跑参评模子;在文生图使命上,GenEval与DPG-Bench的优异体现证实晰其相比头部开源与闭源模子依然具备强竞争力。
▲人类主观评分比照& 并列比照评估胜率
在更贴近用户体验的主观评测(文生图方面接纳大规模的人工主观评分与图像编辑方面接纳严酷的并列比照评估)中,LongCat-Image在真实度方面相比主流开闭源模子体现精彩,同时在文本-图像对齐与合理度上抵达开源SOTA水平;至于综合编辑质量和视觉一致性方面,虽然与Nano Banana等商业闭源模子仍有一定差别,但在开源领域已形成领先优势。
值得一提的是,为了构建一个更透明、开放、协作的开源生态系统,美团 LongCat团队此次周全开源了从Mid-training到Post-training的文生图多阶段模子及图像编辑模子,旨在支持以前沿研究到商业应用的全流程。相关资源已在Hugging Face和GitHub上线,用户也可在官网longcat.ai上体验。
与此同时,面向终端用户的“LongCat APP”也迎来重大升级,全新上线的图生图功效与24个零门槛玩法模板,让通俗用户也能一键天生海报、精修人像,实现“专业AI创作零门槛”。
美团LongCat团队还体现:“我们坚信,真正的手艺前进源于社区的整体智慧。现诚邀宽大开发者体验模子、加入共建,与我们配合基于这个高效能模子,探索视觉天生的更多可能。”
·Hugging Face:https://huggingface.co/meituan-longcat/LongCat-Image
·GitHub:https://github.com/meituan-longcat/LongCat-Image
相关版本
多平台下载
审查所有0条谈论>网友谈论
北京免费毛片
欧美一级特黄aaaaaa片在线视频
亚洲日韩另类欧美一区二区
黄漫扒衣模拟器
欧美专区线
在线免费电影你懂的
成人快手下载
开心五月丁香花久久爱深深爱原因
看黄色大片jB
免费国产一级av黄色片
农村妇女乱子视频
日韩精品一区二区三区人人
办公室熟妇人妻久久精品
久青首页
国产欧美日韩看片片在线人成
中文字幕第23页
小月官方云盘下载链接
maplestar玛奇玛的奖励
国内自拍第十页
国产 亚洲 无码 激情
两年半视频
97人人操人人摸在线视品
又大又粗又爽又色又色
扒开❌狂揉❌喷水视频网站
微博啊哈别项了美瓷
免费深夜3000黄禁用免费a尿道口