编辑
评语
Zero123,一种从单个图像到一致的多视图扩散基础模型,旨在使用单视图输入生成 3D 一致的多视图图像。
产品简介
今天,我们发布了稳定版 Zero123,这是我们内部训练的模型,用于生成视图条件图像。与之前最先进的 Zero123-XL 相比,稳定的 Zero123 产生了显着改善的结果。这是通过 3 项关键创新实现的:
1、改进的训练数据集,从 Objaverse 中大量过滤,只保留高质量的 3D 对象,我们渲染的对象比以前的方法更加真实。
2、在训练和推理过程中,我们为模型提供了估计的摄像机角度。这种海拔调节使其能够做出更明智、更高质量的预测。
3、预先计算的数据集(预先计算的潜在变量)和改进的数据加载器支持更高的批量大小,与第一个创新相结合,与 Zero123-XL 相比,训练效率提高了 40 倍。
Zero123特征:
稳定的 Zero123 可以生成物体的新颖视图,展示从各个角度对物体外观的 3D 理解,由于训练数据集和高程条件的改进,其质量比 Zero1-to-3 或 Zero123-XL 显着提高。
该模型基于稳定扩散 1.5,消耗与 SD1.5 相同数量的 VRAM 来生成 1 个新视图。使用 Stable Zero123 生成 3D 对象需要更多时间和内存(建议使用 24GB VRAM)。
为了实现 3D 对象生成方面的开放研究,我们改进了 Threestudio 开源代码的开源代码,以支持 Zero123 和 Stable Zero123。 Stable 3D 流程的简化版本目前处于私人预览阶段。从技术角度来说,这使用分数蒸馏采样 (SDS) 来使用稳定的 Zero123 模型来优化 NeRF,稍后我们可以从中创建纹理 3D 网格。该过程可以适用于文本到 3D 生成,首先使用 SDXL 生成单个图像,然后使用 Stable Zero123 生成 3D 对象。
Zero123项目:https://github.com/cvlab-columbia/zero123
Zero123试用:https://huggingface.co/spaces/cvlab/zero123-live
Zero123论文:https://arxiv.org/abs/2303.11328
该模型现已发布在 Hugging Face 上,研究人员和非商业用户可以下载并进行实验。
新品更多
猜你喜欢更多
八大影视台词搜索神器,剪辑师必备!
2024-12-26
八大影视台词搜索神器,剪辑师必备!_映技派,专注ai人工智能!,各位朋友们,大家晚上好,给各位老铁推荐几个不错的影视台词搜索网站,剪辑师一定不要错过哦!有些朋友在看某条或某音短视频的时候,是不是很好奇或者又非常喜欢这段视频的某些台词呢?想必大家深有体会,一些经典有意义的台词真的能带给人一些感动和感悟。现在就给大家推荐这7个非常有用的运用台词就能搜索到影视剧名称的网站,肯定会对你有所帮助的,感谢大家!1、33台词-电影台词搜索引擎(http: 33 agile
相关资讯更多
AI教程资讯青岛恒星科技学院与两单位签订协议 在人工智能领域深度合作2025-04-19
AI教程资讯CodeGeeX安装、部署、配置和使用教程2025-04-19
AI教程资讯消息指贝莱德与微软计划成立超300亿美元人工智能投资基金2025-04-19
AI教程资讯ReCamMaster:一种从单个视频生成新视角和运动轨迹视频的框架2025-04-19
AI教程资讯恒荣汇彬:AI时代智能化解决方案与未来发展2025-04-19
AI教程资讯TxAgent:用于治疗推理和个性化药物治疗方案制定的AI智能体2025-04-19
AI教程资讯AI时代的版权保护面临新挑战?“加强版权运用和保护,推动产业高质量发展”论坛探讨对策2025-04-19
AI教程资讯Mistral AI发布Mistral Small 3.1:支持多模态、多语言、128K上下文窗口2025-04-19
AI教程资讯人工智能可帮助寻找暗物质2025-04-19
AI教程资讯秘塔AI搜索生成互动网页功能怎么用?2025-04-18
新品榜/热门榜