文章来源:放心AI网发布时间:2025-05-10 15:27:09
近日,南京大学的研究团队与字节跳动、西南大学联合推出了一项创新技术 ——STAR(Spatial-Temporal Augmentation with Text-to-Video Models),旨在利用文本到视频模型,实现真实世界视频的超分辨率处理。该技术结合了时空增强方法,能够有效提高低分辨率视频的质量,尤其适用于在视频分享平台上下载的低清晰度视频。
为了方便研究者和开发者使用,研究团队已经在 GitHub 上发布了 STAR 模型的预训练版本,包括 I2VGen-XL 和 CogVideoX-5B 两种型号,以及相关的推理代码。这些工具的推出标志着在视频处理领域的一次重要进展。
使用该模型的过程相对简单。首先,用户需要从 HuggingFace 下载预训练的 STAR 模型,并将其放入指定目录。接着,准备待测试的视频文件,并选择适合的文本提示选项,包括无提示、自动生成或手动输入提示。用户只需调整脚本中的路径设置,便可轻松进行视频超分辨率的处理。
该项目特别设计了两种基于 I2VGen-XL 的模型,分别用于不同程度的视频降质处理,确保能够满足多种需求。此外,CogVideoX-5B 模型专门支持720×480的输入格式,为特定场景提供了灵活的选择。
该研究不仅为视频超分辨率技术的发展提供了新的思路,还为相关领域的研究者们开辟了新的研究方向。研究团队对 I2VGen-XL、VEnhancer、CogVideoX 和 OpenVid-1M 等前沿技术表示感谢,认为这些技术为他们的项目奠定了基础。
项目入口:https://github.com/NJU-PCALab/STAR
相关攻略 更多
最新资讯 更多
字节联合高校出品!STAR模型:提升视频清晰度和分辨率
更新时间:2025-05-10
Grok即将推出“失控模式”:回应更为尖锐和冒犯性
更新时间:2025-05-10
WEF研究发现企业优先考虑人工智能培训而不是裁员
更新时间:2025-05-10
一个人开车不孤单!三星Harman发布情感AI伴侣Luna
更新时间:2025-05-10
你绝对想不到!重复这个简单指令让AI生成代码快100倍
更新时间:2025-05-10
世界经济论坛研究:企业更倾向于AI培训而非裁员
更新时间:2025-05-10
因用户投诉,微软回滚BingAI图像生成器升级、重返旧版DALL-E
更新时间:2025-05-10
新晋AI穿戴设备Omi:用脑机接口提升你的工作效率
更新时间:2025-05-10
国务院国资委:要大力发展人工智能,加快建立适应人工智能发展的体制机制
更新时间:2025-05-10
巨量引擎旗下AIGC工具“即创”正式版上线支持智能成片、爆款裂变等功能
更新时间:2025-05-10