文章来源:放心AI网发布时间:2025-04-17 14:14:20
在图像生成领域,多层图像生成技术正逐渐改变用户与生成模型的互动方式,允许用户隔离、选择并编辑特定的图像层。近日,微软研究人员推出了一种名为 “Anonymous Region Transformer”(ART)的新型技术,它能够根据全球文本提示和匿名区域布局,直接生成可变多层透明图像。
ART 的设计灵感来源于 “图式理论”,通过采用匿名区域布局,使生成模型可以自主决定哪些视觉信息与哪些文本信息对齐。这一方法与以往的语义布局形成鲜明对比。传统的语义布局通常需要明确的对应关系,而 ART 的匿名区域布局则提供了更大的灵活性。
值得注意的是,ART 引入了一种逐层区域裁剪机制,该机制只选择与每个匿名区域相关的视觉信息,从而显著降低了注意力计算的成本。这种方法不仅加快了生成速度,使其比全注意力方法快12倍以上,还有效减少了图层之间的冲突,能够处理50个以上不同层次的图像生成。
此外,ART 还提出了一种高质量的多层透明图像自编码器,支持以联合方式直接编码和解码可变多层图像的透明度。这一创新设计为精确控制和可扩展的层生成提供了新的可能性,进一步推动了交互式内容创作的发展。
相关攻略 更多
最新资讯 更多
AI语音独角兽ElevenLabs完成2.5亿美元C轮融资,估值突破30亿
更新时间:2025-04-29
百川智能推出国内首个全场景深度思考医疗大模型,革新医学推理方式
更新时间:2025-04-29
奥特曼加码长寿科技:RetroBiosciences欲筹10亿美元,挑战人类寿命极限
更新时间:2025-04-29
OpenAI新成立的PBC部门估值达300亿美元,微软投资股份尚未确定
更新时间:2025-04-29
扎克伯格表示,2025年底Meta将拥有130万个用于AI的GPU
更新时间:2025-04-29
德勤:企业在推行生成式AI项目上面临规模化挑战
更新时间:2025-04-29
AI基础设施争夺战愈演愈烈:OpenAI与微软的微妙关系
更新时间:2025-04-29
聊天机器人平台CharacterAI以第一修正案为由申请驳回与青少年自杀案的诉讼
更新时间:2025-04-29
Deezer日均上传超万首AI音乐,平台开始检测与标记
更新时间:2025-04-29
AI创业公司GameOn创始人与律师妻子被控6000万美元投资诈骗
更新时间:2025-04-29