免费精品国偷自产在线洗澡,海量高清资源免费畅享,热门影视综艺一网打尽

k1体育麻将胡了

搜索 猫眼影戏 融媒体矩阵
  • 山东手机报

  • 猫眼影戏

  • 公共网官方微信

  • 公共网官方微博

  • 抖音

  • 人民号

  • 天下党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

视频模子原生支持行动一致 ,只是你不会用!揭开「首帧」的神秘

2025-12-03 21:59:20
泉源:

猫眼影戏

作者:

陈烈贤

手机审查

  猫眼影戏记者 詹积富 报道Q8X2R7L1T4J5M9B6W3

新智元报道

编辑:LRST

【新智元导读】最新要领FFGo改变了我们对视频天生模子中第一帧的明确。第一帧并非简朴起点 ,而是模子的「看法影象体」 ,存储了后续画面的视觉元素。FFGo通过少量样本和特殊训练 ,激活模子的这种能力 ,实现高质量的视频定制 ,无需修改模子结构或大宗数据 ,为视频天生开发了新偏向。

在Text-to-Video / Image-to-Video 手艺突飞猛进的今天 ,我们已经习惯了这样一个知识:

视频天生的第一。‵irst Frame)只是时间轴的起点 ,是后续动画的起始画面。

但马里兰大学、南加利福尼亚大学、麻省理工学院的最新研究发明:第一帧的真正角色完全不是「起点」 ,它着实是视频模子的「看法影象体」(conceptual memory buffer), 所有后续画面引用的视觉实体 ,都被它默默贮保存这一帧里。

论文链接:https://arxiv.org/abs/2511.15700

项目主页:http://firstframego.github.io

该研究的起点 ,源于对视频天生模子中一个普遍保存但尚未被系统研究的征象的深入思索。

论文的焦点洞察很是大胆:视频天生模子会自动把首帧中的角色、物体、纹理、结构等视觉实体 ,所有「记着」 ,并在后续帧中一直复用。

换句话说 ,岂论你给几多参考物体 ,模子都会在第一帧悄悄把它们打包成一个「看法蓝图(blueprint)」。

研究者用Veo3、Sora2、Wan2.2等视频模子测试发明:

若首帧泛起多工具组合, 在很少的情形下 ,通过使用特殊的转场提醒词 ,模子在后续帧里能自然融合它们, 甚至能支持跨场景转场、坚持角色属性一致 ;

可是这个神奇的转场提醒词 关于每个模子 ,每个要天生的视频都是纷歧样的 ,并且模子在转场融合多物体后常 ;岜⑽锾 ,场景一致性损失 ,或者物体丧失的问题。

这说明:

? 第一帧是模子「影象」外来参考的地方

? 但默认情形下 ,这种能力「不稳固、不可控」

FFGo要领

不改结构、不大规模微调 ,只用20–50个例子就能让任何预训练的视频模子变身强盛的「参考图驱动视频定制系统」。

研究者基于这个洞见提出了一套极其轻量的做法 :FFGo。

要害优势震撼整个行业:

? 不修改任何模子结构? 不需要百万级训练数据? 只需 20–50 个 carefully curated 的视频例子? 几个小时的 LoRA 训练? 就能实现SOTA级别的视频内容定制

这在现有要领中险些是不可想象的。

研究职员列出了6大应用场景:

机械人操作(Robot Manipulation)

自动驾驶模拟(Driving Simulation)

航拍/水下/无人机模拟(Aerial / Underwater)

多产品展示

影视制作

恣意多角色组合视频天生

用户只需要给模子一张包括多个物体/角色的首帧 ,再配一个文本prompt ,FFGo就能让模子自动「记着」所有元素并天生交互视频, 且画面一致性、物体身份坚持、行动连贯都很是强 ,甚至支持「多达5个参考实体同时融合」, 而 VACE/SkyReels-A2限制在3个以内 ,会直接漏物体。

手艺亮点

用VLM自动构建20–50条高质量训练集

用Gemini-2.5 Pro自动识别远景物体, 用SAM2提取RGBA mask, 自动天生视频文本形貌,构建适配视频模子输入的训练样本, 这大大降低了手工事情量。

使用Few-shot LoRA激活模子「影象机制」

研究发明:

模子自然具备融合多参考物体的能力, 但默认难以「触发」

一段特殊prompt(如「ad23r2 the camera view suddenly changes」)能起到「转场信号」的作用

LoRA学到的不是新能力 ,而是「怎样触发这些能力」 ,推理时只需丢掉前4。╓an2.2的压缩。

视频真正的混淆内容在第5帧之后最先。前4帧是压缩帧 ,直接舍弃即可。

FFGo为什么这么强?

研究职员做了大宗比照实验:? FFGo 能坚持物体身份一致性(Identity Preservation)? 能处置惩罚更多参考工具(5个 vs 3个)? 能阻止大模子微调带来的「灾难性遗忘」? 输出画面更自然、更连贯

特殊是在多物体场景和通用的多物体互动场景下 FFGo的天生效果显著优于VACE和SkyReels-A2。

基础模子无意「乐成」 ,代表了什么?

在研究FFGo的历程中 ,有一个特殊要害的实验图示值得单独拿出来说:在无意的、极有数的情形下 ,Wan2.2原始I2V模子也能完成一次「完善」的使命:

多个参考物体没有消逝

场景转场坚持稳固

行动连贯、身份一致

与文本提醒(例如 wingsuit 航行者与 Cybertruck 贴合运动)高度匹配

若是只看这一组效果 ,你甚至会以为原始模子自己就具备稳固的多工具融合能力。

但事实恰恰相反 ,乐成的意义并不在于「基础模子体现很好」 ,而是在于:基础模子原来就「拥有」这种能力 ,只是大大都时间无法被稳固激活。

研究团队的洞察在这里被证实:

? 视频天生模子确实会把多个参考实体存进第一帧的内部影象结构中? 视频模子自己能执行「多工具+行动一致」的天生? 但这种行为默认险些不可控、不稳固、难复现

这就像模子体内藏着一块「隐藏 GPU」 ,无意会亮一下 ,但你完全不可指望它全天候事情。

FFGo不是教会模子新能力 ,而是让它「稳固施展」

在上述比照中 ,FFGo的效果与原始模子的「无意乐效果果」险些一致 ,这说明:FFGo的LoRA不是在重写模子 ,而是在激活已有的潜在能力。

换句话说:原始模子=有潜力 ,但无法一连施展 ,而FFGo=让潜力酿成稳固能力(且不破损预训练知识)

论文中提到 ,FFGo能保存原模子的天生质量 ,而不是像古板大规模微调那样牺牲泛化能力, 没有任何微调可以媲美预训练的数据质量和学习效果。

这个实验也证实晰一件极具革命性的事:首帧自己就具备「看法影象体」的角色、视频模子天生可以做多工具融合、要害只是缺乏一个「触发机制」。

FFGo做的就是:用几十条样本、一个全心设计的转场标记(transition phrase)、Few-shot LoRA ,把这种能力重新「开机」 ,并且让它可控、稳固、可靠。

这也是为什么:FFGo能用20–50个样例 ,把SOTA模子甩在死后。

这个实验所转达的 ,实质上就是一句话:视频模子已经足够强 ,只是我们已往一直没有找到准确的用法。

而FFGo正是在教我们一件事:怎样「准确使用」视频天生模子。

总结

用一句话归纳综合这篇论文的研究意义:它不是让模子学会新能力 ,而是教我们怎样使用模子已经拥有但从未被准确使用的能力。

研究职员提出了一个极具启发性的未来偏向:

更智慧地使用模子 ,而不是更暴力地训练模子 用更少的数据、更轻的微调 ,获得更强的定制能力 把「首帧作为看法影象体」酿成视频天生的新范式

总之 ,在视频模子中:

第一帧不是起点 ,而是模子的「影象库」 , 视频模子自然具备多工具融合能力

FFGo用极低本钱把这种能力「叫醒」 , 不改结构、不必大数据 , 仅20–50个例子即可实现SOTA视频定制

实验笼罩机械人、驾驶、影视等多场景 , 用户研究中以81.2%票数大幅领先

这篇论文不但是一个手艺突破 ,更像是翻开了视频天生模子的「隐藏手艺树」。

参考资料:

https://arxiv.org/abs/2511.15700

秒追ASI

?点赞、转发、在看一键三连?

点亮星标 ,锁定新智元极速推送!

UniV

??时势1:99国产精品视频久久久久

??12月03日,影游跨界融合催生国漫新动力,

  二是要夯实基础 ,培育一支好步队。“把农村作育成致富能手 ,把优异的致富能手作育成 ,把致富能手中的优异分子作育成村干部” ,这是新时期农村教育作育的目的 ,要凭证这个作育的要求 ,一是要抓好现有步队的政治理论、执律例则教育和科技文化知识培训 ,使农村加深对党的基本蹊径和党的农村政策的明确 ,增强贯彻执行的坚定性、自觉性 ,明确的标准 ,认清自己在生长农村经济 ,推动农村社会周全前进中的责任 ,强化市场经济意识和执法意识 ,学会运用市场经济知识和执法知识效劳。二是要坚持“三会一课”制度。“三会一课”制度是搞好头脑教育的有用形式 ,要以党的先进性教育为契机 ,通过召开“支委会、党小组会、大会、上党课”等形式来增强恒久性的教育 ,来提高他们的政治头脑素质。三是要着眼于提高农村的素质 ,多渠道、多条理、多形式地抓好的科技培训。对一些高新适用手艺 ,可先组织通过短期培训、外出旅行、请强人传经等多种形式举行学习培训 ,坦荡思绪 ,增添见识 ,使他们掌握一定的先进适用手艺 ,成为向导群众致富奔小康的带动人 ,抵达生长有目的 ,致富有本事的目的。四是要一直探索增强治理的有用途径。增强步队建设 ,要有载体 ,一定的内容要通过一定的形式体现出来 ,好比在农村开展的联系户、配合致富小组、支部帮带等活动 ,对增强步队的治理都起到了很好的作用。五是要继续增强对外出务工做生意农村的治理 ,做好《流动活动证》的挂号发放事情 ,做好流动的跟踪治理。六是要切实重视生长优异青年农民入党的事情。要起劲做好宣布道育事情 ,使青年农民相识党的基本知识 ,增强入党的愿望和要求 ,并接纳种种方法增强作育 ,把切合条件的实时吸收到党内来 ,逐步改善农村步队年岁偏大、文化偏低的状态 ,为党的步队增补新鲜血液。从而使下层党组织越发顽强有力 ,更好地担负起向导群众致富奔小康的重任。

,无码va真人一级毛片免费。

??12月03日,今年前5个月南京海关RCEP签证出口货值135.73亿元,

  第二 ,请你做到 ,对自己认真!作为一个小学生 ,我们有自己的行为规范 ,我们有自己的`品德要求 ,请你以此为标准要求自己。让“讲文明、讲卫生、守纪律、尊尊长”成为你的生涯习惯 ,让准时完成学习使命成为你的学习习惯 ,当你发明你做到了”对自己认真”这五个的时间 ,你一定会感受到格外的轻松!

,91欧美激情在线观看,欧美片日韩片国产片精品不卡,看真人视频一一级毛片。

??时势2:亚洲无码你懂的

??12月03日,李强在河北调研时强调 坚持创新驱动发展 加快全面绿色转型 在推进京津冀协同发展中展现新作为,

  客观的讲 ,公司在久远生长方面 ,现在还只是一个具有一定实力和一定规模的企业 ,离我们追求卓越品质的企业目的尚有很大的差别。从横向来看 ,按经济指标 ,公司人均工业总产值、人均利润在偕行业中尚处于中下游水平;按装备资源、手艺工艺手段 ,虽然现在部分装备瓶颈有所改善 ,但装备、手艺条件仍然偏下 ,特殊是在研发设计方面与各先进公司相比 ,仍有很大的差别。同时 ,公司内部保存的问题触目皆是 ,禁止忽视。

,一级毛片在线视频免费看,免黄色网站费视频,av性爱毛片在线播放。

??12月03日,王毅:真朋友就是在关键时刻相互支持,

  “那可是一头真正的远古异种啊 ,在山脉深处都算是一方巨头 ,若是能够获得它的遗体 ,提取到真血 ,摹刻下骨骼上的原始宝符 ,那无疑等若开启了一个惊天的宝藏。 

?第十七章 宝术,大屌日小屄视频,黑料吃瓜+进https://rfb3.js013fr.pro:5288,尤物网站在线。

??时势3:黄的免费视频真人

??12月03日,AI眼中的中国|春来植新绿,静待成荫时,

  一行人踏入后 ,有种时光碎片流逝 ,空间条理杂乱的感受 ,肉身与精神像是要疏散 ,被单独剥落 ,这是一种奇异的体验。

,香蕉视频破解版,小舞吃唐三钢筋,护士脱了精光让人摸秘 喂奶。

??12月03日,第五届全球教师教育峰会举行,

  远方 ,另一片大地。

,迪丽热巴的8888XXXXX,被插入视频,啪网站激情。

??时势4:91蓝莓视频入口

??12月03日,第十七届“香港杯”外交知识竞赛在港启动,

  “孩子别哭 ,村中所有人都是你的亲人 ,这里就是你的家。”石云峰以粗糙的手掌帮他擦去小脸上的泪水。

,中国xnxxx,91毛片视频免费看,97在线无码精品入口原神。

??12月03日,(聚焦海峡论坛)第十届海峡茶会暨首届两岸红茶交流大会在福建福安举办,

  专心:头脑苏醒、精神集中的条件。只有专心致志才华坚持头脑苏醒 ,才华感知深刻、起劲头脑 ,才华处于最佳心理和心理状态。

,日本肏屄视频,人人干人人操三级片,三级片一级毛片。

责编:刘志毅

审核:林厚新

责编:崇惟志

相关推荐 换一换

Copyright (C) 2001-   dzwww.com. All Rights Reserved

新闻信息效劳允许证 - 音像制品出书允许证 - 广播电视节目制作谋划允许证 - 网络视听允许证 - 网络文化谋划允许证

山东省互联网传媒集团主理  联系电话:0531-85193202  违法不良信息举报电话:0531-85196540

鲁ICP备09023866号-1   鲁公网安备 37010202000111号  

Copyright (C) 2001- Dzwww   鲁ICP备09023866号-1

网站地图