Add BlenderCamera

Summary: Adding BlenderCamera (for rendering with R2N2 Blender transformations in the next diff). Reviewed By: nikhilaravi Differential Revision: D22462515 fbshipit-source-id: 4b40ee9bba8b6d56788dd3c723036ec704668153
2025-11-30 04:24:17 +08:00 · 2020-07-23 10:15:50 -07:00 · 2020-07-23 10:15:50 -07:00 · 722c2b7149
commit 722c2b7149
parent 483e538dae
4 changed files with 55 additions and 3 deletions
--- a/pytorch3d/datasets/init.py
+++ b/pytorch3d/datasets/init.py
@ -1,6 +1,6 @@
 # Copyright (c) Facebook, Inc. and its affiliates. All rights reserved.
-from .r2n2 import R2N2
+from .r2n2 import R2N2, BlenderCamera
 from .shapenet import ShapeNetCore
 from .utils import collate_batched_meshes
--- a/pytorch3d/datasets/r2n2/init.py
+++ b/pytorch3d/datasets/r2n2/init.py
@ -1,6 +1,6 @@
 # Copyright (c) Facebook, Inc. and its affiliates. All rights reserved.
-from .r2n2 import R2N2
+from .r2n2 import R2N2, BlenderCamera
 __all__ = [k for k in globals().keys() if not k.startswith("_")]
--- a/pytorch3d/datasets/r2n2/r2n2.py
+++ b/pytorch3d/datasets/r2n2/r2n2.py
@ -11,11 +11,18 @@ import torch
 from PIL import Image
 from pytorch3d.datasets.shapenet_base import ShapeNetBase
 from pytorch3d.io import load_obj
 from pytorch3d.renderer.cameras import CamerasBase
 from pytorch3d.transforms import Transform3d
 from tabulate import tabulate
 SYNSET_DICT_DIR = Path(__file__).resolve().parent
 # Default values of rotation, translation and intrinsic matrices for BlenderCamera.
 r = np.expand_dims(np.eye(3), axis=0)  # (1, 3, 3)
 t = np.expand_dims(np.zeros(3), axis=0)  # (1, 3)
 k = np.expand_dims(np.eye(4), axis=0)  # (1, 4, 4)
 class R2N2(ShapeNetBase):
    """
@ -217,3 +224,27 @@ class R2N2(ShapeNetBase):
            model["images"] = torch.stack(images)
        return model
 class BlenderCamera(CamerasBase):
    """
    Camera for rendering objects with calibration matrices from the R2N2 dataset
    (which uses Blender for rendering the views for each model).
    """
    def __init__(self, R=r, T=t, K=k, device="cpu"):
        """
        Args:
            R: Rotation matrix of shape (N, 3, 3).
            T: Translation matrix of shape (N, 3).
            K: Intrinsic matrix of shape (N, 4, 4).
            device: torch.device or str.
        """
        # The initializer formats all inputs to torch tensors and broadcasts
        # all the inputs to have the same batch dimension where necessary.
        super().__init__(device=device, R=R, T=T, K=K)
    def get_projection_transform(self, **kwargs) -> Transform3d:
        transform = Transform3d(device=self.device)
        transform._matrix = self.K.transpose(1, 2).contiguous()  # pyre-ignore[16]
        return transform
--- a/tests/test_r2n2.py
+++ b/tests/test_r2n2.py
@ -11,13 +11,16 @@ import numpy as np
 import torch
 from common_testing import TestCaseMixin, load_rgb_image
 from PIL import Image
-from pytorch3d.datasets import R2N2, collate_batched_meshes
+from pytorch3d.datasets import R2N2, BlenderCamera, collate_batched_meshes
 from pytorch3d.renderer import (
    OpenGLPerspectiveCameras,
    PointLights,
    RasterizationSettings,
    look_at_view_transform,
 )
 from pytorch3d.renderer.cameras import get_world_to_view_transform
 from pytorch3d.transforms import Transform3d
 from pytorch3d.transforms.so3 import so3_exponential_map
 from torch.utils.data import DataLoader
@ -258,3 +261,21 @@ class TestR2N2(TestCaseMixin, unittest.TestCase):
                "test_r2n2_render_by_categories_%s.png" % idx, DATA_DIR
            )
            self.assertClose(mixed_rgb, image_ref, atol=0.05)
    def test_blender_camera(self):
        """
        Test BlenderCamera.
        """
        # Test get_world_to_view_transform.
        T = torch.randn(10, 3)
        R = so3_exponential_map(torch.randn(10, 3) * 3.0)
        RT = get_world_to_view_transform(R=R, T=T)
        cam = BlenderCamera(R=R, T=T)
        RT_class = cam.get_world_to_view_transform()
        self.assertTrue(torch.allclose(RT.get_matrix(), RT_class.get_matrix()))
        self.assertTrue(isinstance(RT, Transform3d))
        # Test getting camera center.
        C = cam.get_camera_center()
        C_ = -torch.bmm(R, T[:, :, None])[:, :, 0]
        self.assertTrue(torch.allclose(C, C_, atol=1e-05))