(5分钟快速入门)亚洲一区二区三区-国产福利91精品苹果版v92.96.13.93.07.24-2265安卓网

k1体育麻将胡了

搜索 猫眼影戏 融媒体矩阵
  • 山东手机报

  • 猫眼影戏

  • 公共网官方微信

  • 公共网官方微博

  • 抖音

  • 人民号

  • 天下党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

视频模子原生支持行动一致 ,只是你不会用!揭开「首帧」的神秘

2025-12-04 22:12:38
泉源:

猫眼影戏

作者:

郭宗根

手机审查

  猫眼影戏记者 徐吉福 报道Q8X2R7L1T4J5M9B6W3

新智元报道

编辑:LRST

【新智元导读】最新要领FFGo改变了我们对视频天生模子中第一帧的明确。第一帧并非简朴起点 ,而是模子的「看法影象体」 ,存储了后续画面的视觉元素。FFGo通过少量样本和特殊训练 ,激活模子的这种能力 ,实现高质量的视频定制 ,无需修改模子结构或大宗数据 ,为视频天生开发了新偏向。

在Text-to-Video / Image-to-Video 手艺突飞猛进的今天 ,我们已经习惯了这样一个知识:

视频天生的第一。‵irst Frame)只是时间轴的起点 ,是后续动画的起始画面。

但马里兰大学、南加利福尼亚大学、麻省理工学院的最新研究发明:第一帧的真正角色完全不是「起点」 ,它着实是视频模子的「看法影象体」(conceptual memory buffer), 所有后续画面引用的视觉实体 ,都被它默默贮保存这一帧里。

论文链接:https://arxiv.org/abs/2511.15700

项目主页:http://firstframego.github.io

该研究的起点 ,源于对视频天生模子中一个普遍保存但尚未被系统研究的征象的深入思索。

论文的焦点洞察很是大胆:视频天生模子会自动把首帧中的角色、物体、纹理、结构等视觉实体 ,所有「记着」 ,并在后续帧中一直复用。

换句话说 ,岂论你给几多参考物体 ,模子都会在第一帧悄悄把它们打包成一个「看法蓝图(blueprint)」。

研究者用Veo3、Sora2、Wan2.2等视频模子测试发明:

若首帧泛起多工具组合, 在很少的情形下 ,通过使用特殊的转场提醒词  ,模子在后续帧里能自然融合它们, 甚至能支持跨场景转场、坚持角色属性一致;

可是这个神奇的转场提醒词 关于每个模子 ,每个要天生的视频都是纷歧样的 ,并且模子在转场融合多物体后常;岜⑽锾 ,场景一致性损失 ,或者物体丧失的问题。

这说明:

? 第一帧是模子「影象」外来参考的地方

? 但默认情形下 ,这种能力「不稳固、不可控」

FFGo要领

不改结构、不大规模微调 ,只用20–50个例子就能让任何预训练的视频模子变身强盛的「参考图驱动视频定制系统」。

研究者基于这个洞见提出了一套极其轻量的做法 :FFGo。

要害优势震撼整个行业:

? 不修改任何模子结构? 不需要百万级训练数据? 只需 20–50 个 carefully curated 的视频例子? 几个小时的 LoRA 训练? 就能实现SOTA级别的视频内容定制

这在现有要领中险些是不可想象的。

研究职员列出了6大应用场景:

机械人操作(Robot Manipulation)

自动驾驶模拟(Driving Simulation)

航拍/水下/无人机模拟(Aerial / Underwater)

多产品展示

影视制作

恣意多角色组合视频天生

用户只需要给模子一张包括多个物体/角色的首帧 ,再配一个文本prompt ,FFGo就能让模子自动「记着」所有元素并天生交互视频, 且画面一致性、物体身份坚持、行动连贯都很是强 ,甚至支持「多达5个参考实体同时融合」, 而 VACE/SkyReels-A2限制在3个以内 ,会直接漏物体。

手艺亮点

用VLM自动构建20–50条高质量训练集

用Gemini-2.5 Pro自动识别远景物体, 用SAM2提取RGBA mask, 自动天生视频文本形貌,构建适配视频模子输入的训练样本, 这大大降低了手工事情量。

使用Few-shot LoRA激活模子「影象机制」

研究发明:

模子自然具备融合多参考物体的能力, 但默认难以「触发」

一段特殊prompt(如「ad23r2 the camera view suddenly changes」)能起到「转场信号」的作用

LoRA学到的不是新能力 ,而是「怎样触发这些能力」 ,推理时只需丢掉前4。╓an2.2的压缩。

视频真正的混淆内容在第5帧之后最先。前4帧是压缩帧 ,直接舍弃即可。

FFGo为什么这么强?

研究职员做了大宗比照实验:? FFGo 能坚持物体身份一致性(Identity Preservation)? 能处置惩罚更多参考工具(5个 vs 3个)? 能阻止大模子微调带来的「灾难性遗忘」? 输出画面更自然、更连贯

特殊是在多物体场景和通用的多物体互动场景下 FFGo的天生效果显著优于VACE和SkyReels-A2。

基础模子无意「乐成」 ,代表了什么?

在研究FFGo的历程中 ,有一个特殊要害的实验图示值得单独拿出来说:在无意的、极有数的情形下 ,Wan2.2原始I2V模子也能完成一次「完善」的使命:

多个参考物体没有消逝

场景转场坚持稳固

行动连贯、身份一致

与文本提醒(例如 wingsuit 航行者与 Cybertruck 贴合运动)高度匹配

若是只看这一组效果 ,你甚至会以为原始模子自己就具备稳固的多工具融合能力。

但事实恰恰相反 ,乐成的意义并不在于「基础模子体现很好」 ,而是在于:基础模子原来就「拥有」这种能力 ,只是大大都时间无法被稳固激活。

研究团队的洞察在这里被证实:

? 视频天生模子确实会把多个参考实体存进第一帧的内部影象结构中? 视频模子自己能执行「多工具+行动一致」的天生? 但这种行为默认险些不可控、不稳固、难复现

这就像模子体内藏着一块「隐藏 GPU」 ,无意会亮一下 ,但你完全不可指望它全天候事情。

FFGo不是教会模子新能力 ,而是让它「稳固施展」

在上述比照中 ,FFGo的效果与原始模子的「无意乐效果果」险些一致 ,这说明:FFGo的LoRA不是在重写模子 ,而是在激活已有的潜在能力。

换句话说:原始模子=有潜力 ,但无法一连施展 ,而FFGo=让潜力酿成稳固能力(且不破损预训练知识)

论文中提到 ,FFGo能保存原模子的天生质量 ,而不是像古板大规模微调那样牺牲泛化能力, 没有任何微调可以媲美预训练的数据质量和学习效果。

这个实验也证实晰一件极具革命性的事:首帧自己就具备「看法影象体」的角色、视频模子天生可以做多工具融合、要害只是缺乏一个「触发机制」。

FFGo做的就是:用几十条样本、一个全心设计的转场标记(transition phrase)、Few-shot LoRA ,把这种能力重新「开机」 ,并且让它可控、稳固、可靠。

这也是为什么:FFGo能用20–50个样例 ,把SOTA模子甩在死后。

这个实验所转达的 ,实质上就是一句话:视频模子已经足够强 ,只是我们已往一直没有找到准确的用法。

而FFGo正是在教我们一件事:怎样「准确使用」视频天生模子。

总结

用一句话归纳综合这篇论文的研究意义:它不是让模子学会新能力 ,而是教我们怎样使用模子已经拥有但从未被准确使用的能力。

研究职员提出了一个极具启发性的未来偏向:

更智慧地使用模子 ,而不是更暴力地训练模子 用更少的数据、更轻的微调 ,获得更强的定制能力 把「首帧作为看法影象体」酿成视频天生的新范式

总之 ,在视频模子中:

第一帧不是起点 ,而是模子的「影象库」 , 视频模子自然具备多工具融合能力

FFGo用极低本钱把这种能力「叫醒」 , 不改结构、不必大数据 , 仅20–50个例子即可实现SOTA视频定制

实验笼罩机械人、驾驶、影视等多场景 , 用户研究中以81.2%票数大幅领先

这篇论文不但是一个手艺突破 ,更像是翻开了视频天生模子的「隐藏手艺树」。

参考资料:

https://arxiv.org/abs/2511.15700

秒追ASI

?点赞、转发、在看一键三连?

点亮星标 ,锁定新智元极速推送!

UniV

??时势1:黄品汇丝瓜草莓绿巨人

??12月04日,2023年度新闻记者职业资格成绩公布,

  这不是一头两头 ,而是足足四五十头 ,一群凶残的巨兽围了上来 ,远比狈村的人威胁大。

,美女扒开隐私无遮挡网站。

??12月04日,外媒:美军驻叙利亚东北部军事基地遭袭,

  “我之前以为国家清静不关我们的事 ,应该是国家向导人才会去关注这些问题 ,这堂课之后 ,我才发明 ,原来我一小我私家做的某些事情也是可以影响到整个国家清静的” ,华中师范大学第一隶属中学学生罗雅欣说。

,网站99国产,亚洲综合色图,乌克兰18嫩白美女裸交。

??时势2:69xxxxxxxxx

??12月04日,和谐共生|情系母亲河 绿色绘安澜,

  列位来宾、列位朋侪。每次相聚都让_大步向前迈向更高更稳的一个台阶 ,每一次展望 ,都是_走向更大绚烂的起点。

,18se视频在线观看,成年人黄色视频免费在线观看,免费视频性性性。

??12月04日,(乡村行·看振兴)从鲜食到精深加工:莱阳梨园唱出致富曲,

  石府 ,绚烂炫目 ,种种圣光齐舞 ,遮蔽天日 ,竟将整座府邸都笼罩了 ,什么也见不到。

,色情网站app下载免费,台湾AV国片精品福利,免费色色视频网站。

??时势3:男男Gay 免费视频灌奶

??12月04日,《图灵奖获奖科学家漫画系列》亮相北京图书订货会,

  州里党委是党的在农村事情的主要的战斗堡垒 ,是联系效劳群众的主要环节 ,肩负着农村下层社会治理和公共效劳的主要职能。随着工业化、城镇化生长一直加速 ,州里党委还肩负增进经济生长 ,推进社会协调 ,维护社会稳固等主要使命。省委、省政府作出“两转变一个推进”的战略安排 ,我市提出“三个加速一个突破”的对策步伐 ,无论是工业、效劳业、旅游业 ,照旧基础设施建设 ,都与州里事情亲近相关 ,特殊是加大基础设施建设力度 ,用地矛盾突出 ,给州里事情带来较大压力。凭证省委、省政府指定的目的要求 ,XX市农村经济社会生长面临难题的使命 ,我以为 ,主要保存以下几个方面的硬使命。首先 ,“”末要实现由 “大都会、大农村”的名堂向城镇化率75%的目的 ,实现新农村建设的跨越式生长 ,压力重大。其次 ,推进农业工业化生长 ,着力生长现代高效农业、生态农业 ,增添农民收入。第三 ,配合工业化、都会化生长 ,加速第二、三工业配套效劳 ,创立新的经济增添点 ,扩大农村就业。要完成好这些艰辛的使命 ,州里党委班子必需坚持做好以下点:

,男男污污视频,人妻丝袜中文字幕三区日韩,国内揄拍国内精品野战视频。

??12月04日,2023年江西省GDP达32200.1亿元 同比增长4.1%,

  开展好农村事情 ,除了要有较量强的政策理论水平、现实事情履历之外 ,还需要考究事情要领、完善事情制度 ,搞好小我私家品行修养 ,以身作则。一要联系群众。村干部不但是村级组织的认真人 ,更是一个村几百户群众确当家人。因此不但要争取和上级党组织的支持 ,更离不开宽大群众的支持。作为村干部 ,要善于同群众打成一片 ,串百家门 ,听百家言 ,解百家难 ,相识群众所体贴的热门、难点问题。老黎民是最重情绪的 ,只要你多同他们拉拉家常 ,聊谈天 ,就能够拉近和群众的距离 ,群众就会把你当成知心人。要争取群众的支持和信任 ,更主要的是要为老黎民办实事。老黎民是最考究实惠的 ,他们选你们当村干部 ,就是希望你们能在任期内多办几件实事。各人要在任期内办为老黎民办几件实事 ,解决几个影响老黎民生产、生涯的热门、难点问题 ,把钱用到刀刃上 ,让老黎民感受到村干部是让他们定心确当家人 ,从而赢得群众的信任和恋慕。二要注重团结。团结就是实力 ,团结出战斗力、出凝聚力 ,能团结人是最大的本事。一个村若是干部不团结就是一盘散沙。目今在个体农村有这样一种征象 ,就是台下整台上 ,台上整台下 ,弄得村里乌烟瘴气 ,群众意见很大。在团结这个问题上 ,村干部特殊是村支部书记首先要负起责任来。要有容人之量 ,要有宽阔的胸怀。对那些对自己有看法、有意见的同志 ,要自动相同 ,消除矛盾 ,增进团结。要有相助的心态。主要就是村 “两委 ” 之间的相助 ,说究竟就是村干部之间增强相助的问题。村 “ 两委 ” 虽然爆发的程序差别 ,法定职能差别 ,可是为村民当家谋福利的目的是一致的。村支部书记要向导好村委会事情 ,就要自动做事情 ,要支持村委会的事情 ,不可过多的包办详细事务 ,更不可把村委会抛在一边 ,而要向导和监视好村委会开展事情 ,由村委会详细认真实验的事情 ,党支部不可两手一撒 ,冷眼旁观 ,而要施展好监视作用 ,多指导 ,多协助 ,多配合。对在事情中爆发的矛盾和不同 ,要通过支部聚会、村民议事会等形式 ,普遍征求群众意见 ,把决议权交给群众 ,让群众当家作主 ,不可搞家长制 ,一言堂。三要注重品行修养。品行修养在干部素质中是第一位的。作为村干部 ,要与人为善。心存善念是做人的基础 ,做官一阵子 ,做人一辈子 ,要抱着对老黎民深挚的情绪开展事情 ,不害人、不坑人、不整人 ,要心里想着群众 ,行动向着群众 ,为群众办实事、办妥事。要坚持平和的心态 ,苏醒地看待名利。要忠实守信。人无信不立 ,作为一名村干部更应该忠实守信。只有你语言算数 ,为人正直 ,效劳公正 ,群众才华相信你 ,你在群众心中才会有位置 ,你语言才有招呼力。若是把对群众的允许当成拉选票的口号 ,一旦坐稳了位置 ,就把当初的允许抛到脑后 ,置群众的利益而掉臂 ,那你这个位置是坐不稳的 ,群众是不会拥护你的。要清廉自律。 “ 公生明 ,廉生威 ”  ,作为村干部 ,就必需清廉自律 ,克己奉公 ,要堂堂正正做人 ,清清白白做事 ,做到心中有正气 ,身上有节气 ,这样你语言才硬气 ,别人才华服你。以是作为村干部 ,一定要洁身自好 ,注重小节 ,时时随处为人楷模 ,真正树立党在群众中的优异形象 ,赢得宽大和农民群众的信任。四要办事公正。农民群众的知足水平 ,是权衡农村事情的最高标准。村干部是为农民效劳的 , “ 官 ” 当得怎么样 ,讲话权在农民群众。要当好村干部 ,必需公正正直。在处置惩罚农村种种矛盾、协调种种利益关系时 ,一定要坚持从阵势出发 ,处以公心 ,公正正直 ,一碗水端平 ,不可凭小我私家好恶效劳 ,也不可偏亲厚友。只有效劳公正 ,才华赢得群众的信任和拥护。五要考究事情艺术。在座的列位开展事人情临的不是亲戚就是朋侪 ,都是熟悉的人 ,这就要求我们思量好种种关系 ,顺好理 ,有一定的向导艺术。学会弹钢琴 ,能够团结一班人形成一个战斗堡垒;还要各项事情走在前头 ,遇到难题带动上 ,难的事情自动干 ,不可相互推诿扯皮。胸怀要宽阔、漂亮 ,做到容人、容事、容话 ,听得进一些同志的阻挡意见 ,能遭受种种误解、谴责和难题 ,团结同志 ,增强班子凝聚力 ,多为村民办实事、办妥事 ,赢得认可。六要增强制度建设。没有规则 ,不可周遭 ,不按制度效劳 ,不严酷效劳程序 ,就有可能盛意办不可好事。这就要求我们必需建设健全各项制度 ,并严酷按制度效劳。一是抓好各项制度的建设。包括 “ 三会一课 ” 制度、学习制度、党支部和目的治理制度、民主评议制度、党组织议事规则等党内制度 ,以及村民议事会制度、村务果真制度等。制订制度纷歧定越多越好 ,而是要轻盈易行 ,便于操作 ,有针对性。二是抓好各项制度的落实。有了制度 ,村干部要带动执行 ,并催促宽大遵守和执行各项制度 ,使制度真正地落到实处 ,阻止把制度当 “安排 ” 。三是抓好制度的完善。制度不是一成稳固的 ,在执行历程中 ,要实时举行修改和完善 ,使制度越发完整 ,更切合农村现实。

,性AAAAAAA欧美,无码视频免费,玩爽japanese性妇。

??时势4:亚洲熟妇丰满XXXX

??12月04日,中国最高检:对暴力恐怖等犯罪坚持该捕即捕、依法追诉,

  “小不点很可怜……”终于有人叹了一口吻 ,这般说道。

,蓝莓漫画大全免费阅读,绑起来刷花缝,免费黄a片在线观看。

??12月04日,第二届中泰治国理政经验互学互鉴高端论坛在曼谷举办,

  整整一天一夜 ,小不点才停下来 ,站起身 ,迎着早霞 ,吞吐曦光 ,以为终于彻底牢靠了 ,三座火山口内敛 ,徐徐消逝 ,他大步向着石村走去。

,学校 拍击 学生 网站,亚洲国产国语对白在线视频,国产精品一级18一区二区。

责编:马建中

审核:傅静君

责编:许沛洁

相关推荐 换一换

Copyright (C) 2001-   dzwww.com. All Rights Reserved

新闻信息效劳允许证 - 音像制品出书允许证 - 广播电视节目制作谋划允许证 - 网络视听允许证 - 网络文化谋划允许证

山东省互联网传媒集团主理  联系电话:0531-85193202  违法不良信息举报电话:0531-85196540

鲁ICP备09023866号-1   鲁公网安备 37010202000111号  

Copyright (C) 2001- Dzwww   鲁ICP备09023866号-1

网站地图