网站目录

昆仑万维开源Matrix-3D大模型,树立3D世界生成新标杆

人工智能行3925个月前

2025 年 8 月 12 日,北京——SkyWork AI 技术发布周第二日,昆仑万维正式开源 Matrix-3D,一键把单张图片或一句文本变成可自由探索的 3D 全景世界。

昆仑万维开源Matrix-3D大模型,树立3D世界生成新标杆

1 分钟速览

  • 开源地址GitHub | Hugging Face | 项目主页

  • 核心亮点:单图/文本 → 全景视频 → 3D 场景,25 FPS 实时浏览

  • 场景范围:支持 360° 水平、180° 垂直,无限续写扩展

  • 生成速度:Feed-Forward 10 秒完成 3D 重建

技术全景

  1. 轨迹引导全景视频生成
    以场景 Mesh 渲染图作条件,扩散模型按给定相机轨迹输出高一致性全景视频。

  2. 双路径 3D 重建
         • 优化路径:超分 + 3DGS,获得精细几何
         • 前馈路径:Transformer 直接回归,10 秒级快速重建

  3. Matrix-Pano 数据集
    116 K 条全景视频、22 M 帧,覆盖 504 个 UE 高保真场景,已计划开源子集。

实战对比:WorldLabs vs HunyuanWorld 1.0 vs Matrix-3D

模型移动范围视角一致性可控扩展
WorldLabs局部有限
HunyuanWorld 1.0局部有限
Matrix-3D大范围无限续写

3 步跑通 Demo

# 克隆仓库
git clone https://github.com/SkyworkAI/Matrix-3D.git && cd Matrix-3D

# 安装依赖
pip install -r requirements.txt

# 单图生成 3D 场景
python demo.py --input image.jpg --output scene.ply --mode fast

应用想象

  • 游戏/影视:分钟级生成 3D 场景,零成本虚拟拍摄。

  • 具身智能:即时构建训练环境,机器人/自动驾驶仿真。

  • VR/AR:一键把照片变成沉浸式空间。

Matrix-3D 现已全面开源,欢迎开发者一起把科幻搬进现实。

分享到:
  • 不喜欢(0

猜你喜欢

网友评论

人工智能行

记录人工智能在各行各业的实际应用。

368 文章
0 页面
127 评论
597 附件
人工智能行最近发表
随机文章
侧栏广告位
狗鼻子AI工具导航网侧栏广告位
最新文章
随机标签