Install
openclaw skills install 3d-vision-graphics3D视觉与计算机图形学研究助手。覆盖NeRF/3D Gaussian Splatting/点云处理/ 网格重建/纹理映射/光线追踪等方向。提供论文解读、算法对比、代码实现、 数据集推荐、实验设计指导。支持Blender/Houdini/Open3D/PyTorch3D等工具链。
openclaw skills install 3d-vision-graphics| 能力维度 | 覆盖范围 | 输出质量 |
|---|---|---|
| 论文解读 | NeRF / 3DGS / InstantNGP / SuGaR / Mip-Splatting 等100+篇 | 含核心公式推导 + 创新点分析 |
| 算法对比 | PSNR/SSIM/LPIPS 基准对比表 | 按数据集/场景分类 |
| 代码实现 | PyTorch / CUDA / Taichi 多后端 | 含注释 + 训练配置 |
| 数据集推荐 | 30+ 常用3D数据集(含规模/场景/许可) | 按任务类型索引 |
| 工具链指导 | Blender / Open3D / PyTorch3D / Kaolin / Houdini | 含安装配置 + 常见坑 |
| 实验设计 | 消融实验 / 对比实验 / 可视化方案 | 含评估指标选择建议 |
| 方法 | 年份 | 核心创新 | 训练时间 | 渲染速度 | PSNR (Synthetic) |
|---|---|---|---|---|---|
| NeRF | 2020 ECCV | MLP隐式表示 + 体渲染 | ~12h | ~30s/frame | 31.01 |
| Mip-NeRF | 2021 ICCV | 锥形采样抗锯齿 | ~12h | ~30s/frame | 33.09 |
| InstantNGP | 2022 SIGGRAPH | 哈希网格编码 | ~5min | ~60fps | 32.78 |
| Mip-NeRF 360 | 2022 CVPR | 无界场景 + 蒸馏 | ~12h | ~30s/frame | 29.48 |
| TensoRF | 2022 ECCV | 张量分解 | ~30min | ~0.5s/frame | 33.14 |
| Plenoxels | 2022 CVPR | 球谐系数 + 体素 | ~11min | ~2s/frame | 31.71 |
| Zip-NeRF | 2023 ICCV | 网格采样 + 抗锯齿 | ~1h | ~0.5s/frame | 33.63 |
| K-Planes | 2023 CVPR | 多维平面分解 | ~52min | ~0.3s/frame | 32.60 |
| 方法 | 年份 | 核心创新 | 训练时间 | FPS | PSNR (Mip-NeRF360) |
|---|---|---|---|---|---|
| 3DGS | 2023 SIGGRAPH | 显式高斯椭球 + 可微光栅化 | ~30min | 100+ | 27.21 |
| Mip-Splatting | 2024 CVPR | 3D频率滤波抗锯齿 | ~40min | 100+ | 27.65 |
| SuGaR | 2024 CVPR | 高斯→网格提取 | ~1h | 100+ | 27.03 |
| Scaffold-GS | 2024 CVPR | 锚点结构化生长 | ~25min | 100+ | 27.44 |
| GaussianPro | 2024 | 渐进式优化策略 | ~20min | 100+ | 27.82 |
| 2DGS | 2024 SIGGRAPH | 2D高斯盘面表示 | ~30min | 100+ | 27.39 |
| PixelSplat | 2024 | 前馈3DGS重建 | ~1s (inference) | 100+ | 25.89 |
| LatentSplat | 2024 ECCV | 潜在空间3DGS | ~10min | 100+ | 26.91 |
| Splatter-Image | 2024 CVPR | 单视图3DGS生成 | ~0.1s | 100+ | 23.12 |
| 任务 | SOTA方法 | 年份 | 关键指标 |
|---|---|---|---|
| 分类 | PointNet++ / PointNeXt / Point-MAE | 2017-2023 | OA 93.2% (ModelNet40) |
| 分割 | PointTransformer V3 / Swin3D | 2023-2024 | mIoU 72.6% (S3DIS) |
| 配准 | GeoTransformer / PEAL | 2022-2024 | RR 99.5% (3DMatch) |
| 补全 | PointTr / AdaPoinTr | 2021-2023 | CD 2.85 (ShapeNet) |
| 上采样 | PU-GCN / SPU-Net | 2021-2023 | CD 0.28 (PU1K) |
| 去噪 | PointCleanNet / PD-Flow | 2020-2023 | MSE 0.015 |
| 生成 | LION / 3DShape2VecSet | 2023-2024 | FID 4.27 |
| 检测 | PointRCNN / 3DETR / FCAF3D | 2019-2023 | mAP 67.3% (ScanNet) |
| 任务 | 方法 | 特点 |
|---|---|---|
| 重建 | Poisson / BPA / Delaunay | 经典几何方法 |
| 简化 | QEM / Edge Collapse | 保持拓扑 |
| 平滑 | Laplacian / Bilateral / Taubin | 去噪保特征 |
| 参数化 | ABF / LSCM / ARAP | UV映射 |
| 变形 | ARAP / LBS / Cage-based | 形状编辑 |
| 细分 | Catmull-Clark / Loop / Doo-Sabin | 增加分辨率 |
| 切割 | MeshCNN / GraphUNet | 学习型分割 |
| 检索 | MeshNet / LSNet | 形状匹配 |
| 数据集 | 场景数 | 分辨率 | 任务 | 许可 |
|---|---|---|---|---|
| LLFF | 8 | 4032×3024 | NVS | CC BY |
| NeRF-Synthetic | 8 | 800×800 | NVS | MIT |
| Tanks & Temples | 21 | 1920×1080 | NVS+MVS | CC BY-NC-SA |
| DTU | 124 | 1600×1200 | MVS | Research Only |
| Mip-NeRF 360 | 9 | ~4K | NVS(无界) | CC BY |
| ScanNet++ | 460 | ~1.5K | 重建+分割 | Research Only |
| Replica | 18 | ~1K | 室内重建 | Research Only |
| BlendedMVS | 113 | 2048×1536 | MVS | CC BY |
| FreeViewSynthesis | 12 | 2048×1080 | NVS | CC BY |
| MVImgNet | 220K对象 | 1080p | 多视图学习 | CC BY |
| 数据集 | 类别数 | 样本数 | 模态 | 许可 |
|---|---|---|---|---|
| ShapeNet | 55 | 51,300 | 3D模型 | Custom |
| ModelNet40 | 40 | 12,311 | 3D模型 | Custom |
| ABC | N/A | 1M+ | CAD模型 | MIT |
| Thingi10K | N/A | 10,000 | 3D打印模型 | CC BY |
| OmniObject3D | 190 | 6,000 | 3D扫描+多视图 | CC BY |
| Objaverse | N/A | 800K+ | 多模态3D | ODC-BY |
| Objaverse-XL | N/A | 10M+ | 多模态3D | ODC-BY |
| GSO | 17 | 1,030 | 扫描物体 | CC BY |
| ABO | 98 | 6,327 | 电商3D模型 | CC BY-NC |
| 数据集 | 内容 | 规模 | 许可 |
|---|---|---|---|
| FaceScape | 3D人脸 | 938人, 20表情 | Research Only |
| 3DFAW | 3D人脸关键点 | 23,076帧 | Custom |
| HUMBI | 人体多视图 | 772人 | Research Only |
| THuman | 3D人体扫描 | 200+人 | Custom |
| RenderPeople | 商业3D人体 | 500+ | 商业许可 |
| AMASS | 人体运动 | 40h+, 300+主体 | Research Only |
| ZJU-MoCap | 动态人体 | 9序列 | Research Only |
import bpy
import numpy as np
# 导入点云
def import_pointcloud(points, colors=None):
mesh = bpy.data.meshes.new("pointcloud")
obj = bpy.data.objects.new("pointcloud", mesh)
bpy.context.collection.objects.link(obj)
mesh.from_pydata(points.tolist(), [], [])
if colors is not None:
color_attr = mesh.color_attributes.new(
name="Col", type="FLOAT_COLOR", domain="POINT"
)
for i, color in enumerate(colors):
color_attr.data[i].color = color.tolist() + [1.0]
# 导入3DGS PLY
def import_3dgs_ply(filepath):
from plyfile import PlyData
plydata = PlyData.read(filepath)
verts = plydata['vertex']
xyz = np.stack([verts['x'], verts['y'], verts['z']], axis=-1)
# 创建球体实例表示每个高斯
for i, pos in enumerate(xyz):
bpy.ops.mesh.primitive_ico_sphere_add(
subdivisions=1, radius=0.01, location=pos
)
# 渲染设置
def setup_cycles_render(samples=128, resolution=(1920, 1080)):
bpy.context.scene.render.engine = 'CYCLES'
bpy.context.scene.cycles.samples = samples
bpy.context.scene.render.resolution_x = resolution[0]
bpy.context.scene.render.resolution_y = resolution[1]
bpy.context.scene.cycles.device = 'GPU'
import open3d as o3d
import numpy as np
# 读取与可视化
pcd = o3d.io.read_point_cloud("scene.ply")
o3d.visualization.draw_geometries([pcd])
# 降采样
pcd_down = pcd.voxel_down_sample(voxel_size=0.02)
# 法线估计
pcd.estimate_normals(
o3d.geometry.KDTreeSearchParamHybrid(radius=0.1, max_nn=30)
)
# ICP配准
reg_p2p = o3d.pipelines.registration.registration_icp(
source, target, max_correspondence_distance=0.05,
init=np.eye(4),
estimation_method=o3d.pipelines.registration.TransformationEstimationPointToPoint()
)
# 泊松重建
mesh, densities = o3d.geometry.TriangleMesh.create_from_point_cloud_poisson(
pcd, depth=9
)
# 半径离群点去除
cl, ind = pcd.remove_radius_outlier(nb_points=16, radius=0.05)
pcd_clean = pcd.select_by_index(ind)
# DBSCAN聚类
labels = np.array(pcd.cluster_dbscan(eps=0.02, min_points=10))
| 问题 | 原因 | 解决方案 |
|---|---|---|
| 3DGS训练发散 | 学习率过大/初始化不当 | 降低lr至1e-4,检查COLMAP稀疏点 |
| 点云配准失败 | 初始位姿差过大 | 先用FPFH+RANSAC全局配准 |
| CUDA OOM | 场景过大/分辨率过高 | 降低SH阶数或分辨率,使用gradient checkpointing |
| 网格有洞 | 点云密度不足 | 增加视角数,调整泊松深度 |
| 渲染闪烁 | 高斯排序不稳定 | 增加densification迭代 |
| 训练慢 | 未使用custom CUDA kernel | 安装diff-gaussian-rasterization |
| 颜色失真 | 色调映射错误 | 检查linear/sRGB色彩空间 |
| 几何塌陷 | 正则化不足 | 增加depth/normal正则化损失 |
¥0.50/次,使用支付宝AI收协议。每次调用提供完整的论文解读/算法对比/代码指导/实验设计方案。