文章来源:放心AI网发布时间:2025-06-02 08:04:58
谷歌研究团队最新推出的 ReCapture 技术,正在颠覆传统视频编辑的玩法。这项创新让普通用户也能轻松实现专业级的摄像机运动调整,为已拍摄的视频重新设计镜头语言。
传统视频后期制作中,改变已拍摄视频的镜头角度一直是个技术难题。现有方案在处理不同类型的视频内容时,往往难以同时保持复杂的运镜效果和画面细节。ReCapture 另辟蹊径,没有采用传统的4D 中间表示方法,而是巧妙利用生成式视频模型中储存的运动知识,通过 Stable Video Diffusion 将任务重新定义为视频到视频的转换过程。
这套系统采用两阶段工作流程。第一阶段生成"锚定视频",也就是具有新机位的初始输出版本。这一阶段可以通过 CAT3D 等扩散模型创建多角度视频,或者通过逐帧深度估计和点云渲染来实现。虽然这个版本可能存在一些时序不连贯和视觉瑕疵,但为第二阶段奠定了基础。
第二阶段应用带遮罩的视频微调,利用在现有素材上训练的生成式视频模型来创建真实的运动效果和时序变化。系统引入了时序 LoRA(低秩适应)层来优化模型,使其能够理解和复制锚定视频的具体动态特征,无需重新训练整个模型。同时,空间 LoRA 层确保了画面细节和内容与新的摄像机运动保持一致。这使得生成式视频模型能够在保持原始视频特征运动的同时,完成变焦、平移和倾斜等操作。
尽管 ReCapture 在用户友好的视频处理方面取得了重要进展,但目前仍处于研究阶段,距离商业化应用还有一段距离。值得注意的是,虽然谷歌拥有众多视频 AI 项目,但尚未将其推向市场,其中 Veo 项目可能最接近商用。同样,Meta 最近推出的 Movie-Gen 模型以及 OpenAI 年初发布的 Sora 也都未实现商业化。目前,视频 AI 市场主要由 Runway 等创业公司引领,该公司已于去年夏天推出了最新的 Gen-3Alpha 模型。
相关攻略 更多
最新资讯 更多
谷歌最新黑科技:AI帮你"重拍"已录制视频,专业级后期效果触手可及
更新时间:2025-06-02
NousChat聊天机器人提供类似于ChatGPT的界面:并允许用户与模型交互而无需自己运行代码
更新时间:2025-06-02
百度文库和百度网盘联合开发自由画布李彦宏:立即可用的现货
更新时间:2025-06-02
想让机器人更智能?清华团队发现机器人学习速成秘诀
更新时间:2025-06-02
马斯克有望入驻白宫?请愿书呼吁特朗普任命其为AI顾问!
更新时间:2025-06-02
李彦宏:大模型幻觉问题基本解决不再胡说八道
更新时间:2025-06-02
预测:2025年CIO们将大幅增加AI投资,相关支出达3370亿美元
更新时间:2025-06-02
百度无代码工具“秒哒”发布支持无代码编程、多智能体协作等能力
更新时间:2025-06-01
MozillaCEO:AI对浏览器的重大影响尚需两到三年
更新时间:2025-06-01
OpenAI转向新训练技术:扩大模型规模已非突破关键
更新时间:2025-06-01