LucidDreamer,LucidDreamer,可以从单个图像的单个文本提示中生成可导航的3D场景。 单击并拖动(导航) 移动和滚动(缩放)以感受3D。
大家好~这里是小编!本期【放心AI网-核心AI】带你解锁超实用AI神器,精选全网热门工具,助你一键开启智能新体验!
随着VR设备和内容的广泛使用,对3D场景生成技术的需求越来越普遍。然而,现有的 3D 场景生成模型将目标场景限制在特定领域,这主要是因为它们使用的 3D 扫描数据集与现实世界相去甚远。为了解决这种局限性,我们提出了LucidDreamer,这是一个无域场景生成管道,它充分利用了现有大规模基于扩散的生成模型的强大功能。
我们的 LucidDreamer 有两个交替步骤:做梦和对齐。
首先,为了从输入生成多视图一致的图像,我们将点云设置为每次生成图像的几何参考。具体来说,我们将一部分点云投影到所需的视图,并提供投影作为使用生成模型进行修复的指导。使用估计的深度图将绘制的图像提升到 3D 空间,从而组成一个新点。
其次,为了将新点聚合到3D场景中,我们提出了一种对齐算法,该算法将新生成的3D场景的各个部分和谐地集成在一起。最终得到的3D场景是优化高斯飞溅的初始点。与以前的 3D 场景生成方法相比,LucidDreamer 生成的高斯飞溅非常详细,对目标场景的域没有限制。
LucidDreamer 可以接受一系列文本提示来生成场景,从而实现细粒度的控制。
基于 CLIP 的 Stable Diffusion 生成的图像对生成的场景进行定量比较。 我们使用 CLIP-Score 和 CLIP-IQA 与 RGBD2 对结果进行定量比较。 对于 CLIP-IQA,我们使用质量、色彩鲜艳和清晰的标准。 LucidDreamer 在所有指标上都显示出占主导地位的结果。
根据初始SfM点的来源重建高斯飞溅的度量。我们使用 COLMAP并比较重建结果。使用我们的点云始终如一地显示出更好的重建指标。
今天的AI工具安利就到这里啦!小伙伴们还想看哪些神器?快留言告诉小编,放心AI网-核心AI下期继续带你挖宝!
需要网络免费
资讯AI更多
资讯AI 更多
甲骨文推出新AI智能体和生成式AI功能,助力销售团队提升客户互动
更新时间:2025-04-30
网易有道推出“子曰-o1”推理模型,教育领域迎来新变革
更新时间:2025-04-30
豆包上线深度推理模式:AI逻辑链条可视化,问答搜索新突破
更新时间:2025-04-17
当AI制药不再讲故事
更新时间:2025-04-30
成都华微:AI算力高达16Tops的人工智能芯片已小批量试用
更新时间:2025-04-30
谷歌全新升级Gemini2.0FlashThinking,长上下文处理能力再创新高
更新时间:2025-04-30
网易有道子曰-o1推理模型正式开源发布专为消费级显卡设计
更新时间:2025-04-30
谷歌推出实时AI视频功能Gemini:手机摄像头瞬间解读画面内容。
更新时间:2025-04-09
苹果重组AI高管团队,Siri升级延后至未来五年规划——AI高管团队重组影响Siri升级计划,预计推迟至2026年。
更新时间:2025-04-09
“星际迷航”黑科技照进现实!AI超声技术斩获百万美元大奖,你的心脏健康要被重新定义了!
更新时间:2025-04-16