文章来源:放心AI网发布时间:2025-06-01 11:03:33
在Vidu上线逾百日之际,生数科技自豪地宣布Vidu1.5新版本的问世,该版本实现了世界领先水平的突破,特别是在理解多样化输入和突破“一致性”难题方面。
Vidu1.5的推出标志着视觉模型进入了全新的“上下文”时代,加速了通用人工智能(AGI)的到来。Vidu在全球上线之初便具备了角色一致性生成能力,通过锁定人物面部特征解决了视频生成中的关键痛点。9月份,Vidu全球率先发布了“主体一致性”功能,将面部一致性拓展至全身一致性,并将范围扩展到动物、物体、虚拟角色等任意主体。Vidu的技术突破主要体现在三个方面:复杂主体的精准控制、人物面部特征和动态表情的自然一致性、多主体一致性。
Vidu1.5展现了视觉模型全新的“智能涌现”,展示了其强大的上下文学习能力。这意味着视觉模型不仅具备了理解和想象的能力,还能够在生成过程中进行记忆管理。Vidu1.5延续了其业界领先的生成效率,不到30秒即可生成一段视频。Vidu秉承通用性的理念,与LLM(大型语言模型)一致的设计哲学,将所有问题统一为视觉输入和视觉输出的问题,使用单个Transformer统一建模变长的输入和输出,并从视频数据的压缩中获取智能。
Vidu1.5的推出,不仅提升了视频模型的可控性,还通过灵活的多元输入实现了多角度、多主体、多元素的一致性生成。这标志着视觉智能的涌现,加速了AGI的到来。Vidu不再仅仅是一个高质量、高效的视频生成器,它还能在生成过程中融入上下文信息和记忆,这是视觉模态智能的“大跨越”。视觉模型将具备更强的认知能力,成为AGI的一块重要拼图。
体验地址:www.vidu.studio
相关攻略 更多
最新资讯 更多
生数科技视频生成模型Vidu1.5版发布攻克“多主体一致性”难题
更新时间:2025-06-01
钉钉AI重磅更新:面向企业关键场景推出“精选AI助理”
更新时间:2025-06-01
对标谷歌NotebookLM!语音生成模型PlayDialog:可生成对话播客、旁白
更新时间:2025-06-01
阿里海外推出全球首个B2B领域AI搜索引擎Accio
更新时间:2025-06-01
斯坦福最新黑科技!场景语言:一句话生成3D大片!
更新时间:2025-06-01
报道称:小米AI眼镜已悄然布局,预计2025年发布
更新时间:2025-06-01
美国AI翻译平台Unbabel推出Widn.AI,CEO预测三年内可能取代人类
更新时间:2025-06-01
百度文心智能体平台已吸引80万名开发者入驻总分发量上涨16倍
更新时间:2025-06-01
百度王海峰:文心一言用户规模达4.3亿
更新时间:2025-06-01
哈佛医学院获600万美元捐赠,打造医疗AI人才培养高地
更新时间:2025-06-01