Windows fix for marching cubes #1398

Summary: See https://github.com/facebookresearch/pytorch3d/issues/1398 . Reviewed By: davidsonic Differential Revision: D42139493 fbshipit-source-id: 972fc33b9c3017554ce704f2f10190eba406b7c8
2025-09-16 01:22:48 +08:00 · 2022-12-20 04:07:04 -08:00 · 2022-12-20 04:07:04 -08:00 · 3388d3f0aa
commit 3388d3f0aa
parent 3145dd4d16
1 changed files with 22 additions and 26 deletions
--- a/pytorch3d/csrc/marching_cubes/marching_cubes.cu
+++ b/pytorch3d/csrc/marching_cubes/marching_cubes.cu
@ -13,7 +13,6 @@
 #include <thrust/scan.h>
 #include <cstdio>
 #include "marching_cubes/tables.h"
 #include "utils/pytorch3d_cutils.h"
 /*
 Parallelized marching cubes for pytorch extension
@ -267,13 +266,12 @@ __global__ void CompactVoxelsKernel(
 //    isolevel: threshold to determine isosurface intersection
 //
 __global__ void GenerateFacesKernel(
-    torch::PackedTensorAccessor32<float, 2, torch::RestrictPtrTraits> verts,
+    at::PackedTensorAccessor32<float, 2, at::RestrictPtrTraits> verts,
-    torch::PackedTensorAccessor<int64_t, 2, torch::RestrictPtrTraits> faces,
+    at::PackedTensorAccessor<int64_t, 2, at::RestrictPtrTraits> faces,
-    torch::PackedTensorAccessor<int64_t, 1, torch::RestrictPtrTraits> ids,
+    at::PackedTensorAccessor<int64_t, 1, at::RestrictPtrTraits> ids,
-    torch::PackedTensorAccessor32<int, 1, torch::RestrictPtrTraits>
+    at::PackedTensorAccessor32<int, 1, at::RestrictPtrTraits>
        compactedVoxelArray,
-    torch::PackedTensorAccessor32<int, 1, torch::RestrictPtrTraits>
+    at::PackedTensorAccessor32<int, 1, at::RestrictPtrTraits> numVertsScanned,
        numVertsScanned,
    const uint activeVoxels,
    const at::PackedTensorAccessor32<float, 3, at::RestrictPtrTraits> vol,
    const at::PackedTensorAccessor32<int, 2, at::RestrictPtrTraits> faceTable,
@ -436,15 +434,15 @@ std::tuple<at::Tensor, at::Tensor, at::Tensor> MarchingCubesCuda(
  cudaStream_t stream = at::cuda::getCurrentCUDAStream();
  // transfer _FACE_TABLE data to device
-  torch::Tensor face_table_tensor = torch::zeros(
+  at::Tensor face_table_tensor = at::zeros(
-      {256, 16}, torch::TensorOptions().dtype(at::kInt).device(at::kCPU));
+      {256, 16}, at::TensorOptions().dtype(at::kInt).device(at::kCPU));
  auto face_table_a = face_table_tensor.accessor<int, 2>();
  for (int i = 0; i < 256; i++) {
    for (int j = 0; j < 16; j++) {
      face_table_a[i][j] = _FACE_TABLE[i][j];
    }
  }
-  torch::Tensor faceTable = face_table_tensor.to(vol.device());
+  at::Tensor faceTable = face_table_tensor.to(vol.device());
  // get numVoxels
  int threads = 128;
@ -458,10 +456,10 @@ std::tuple<at::Tensor, at::Tensor, at::Tensor> MarchingCubesCuda(
  }
  auto d_voxelVerts =
-      torch::zeros({numVoxels}, torch::TensorOptions().dtype(at::kInt))
+      at::zeros({numVoxels}, at::TensorOptions().dtype(at::kInt))
          .to(vol.device());
  auto d_voxelOccupied =
-      torch::zeros({numVoxels}, torch::TensorOptions().dtype(at::kInt))
+      at::zeros({numVoxels}, at::TensorOptions().dtype(at::kInt))
          .to(vol.device());
  // Execute "ClassifyVoxelKernel" kernel to precompute
@ -480,7 +478,7 @@ std::tuple<at::Tensor, at::Tensor, at::Tensor> MarchingCubesCuda(
  // If the number of active voxels is 0, return zero tensor for verts and
  // faces.
  auto d_voxelOccupiedScan =
-      torch::zeros({numVoxels}, torch::TensorOptions().dtype(at::kInt))
+      at::zeros({numVoxels}, at::TensorOptions().dtype(at::kInt))
          .to(vol.device());
  ThrustScanWrapper(
      d_voxelOccupiedScan.data_ptr<int>(),
@ -493,23 +491,21 @@ std::tuple<at::Tensor, at::Tensor, at::Tensor> MarchingCubesCuda(
  int activeVoxels = lastElement + lastScan;
  const int device_id = vol.device().index();
-  auto opt =
+  auto opt = at::TensorOptions().dtype(at::kInt).device(at::kCUDA, device_id);
-      torch::TensorOptions().dtype(torch::kInt).device(torch::kCUDA, device_id);
+  auto opt_long =
-  auto opt_long = torch::TensorOptions()
+      at::TensorOptions().dtype(at::kLong).device(at::kCUDA, device_id);
                      .dtype(torch::kInt64)
                      .device(torch::kCUDA, device_id);
  if (activeVoxels == 0) {
    int ntris = 0;
-    torch::Tensor verts = torch::zeros({ntris * 3, 3}, vol.options());
+    at::Tensor verts = at::zeros({ntris * 3, 3}, vol.options());
-    torch::Tensor faces = torch::zeros({ntris, 3}, opt_long);
+    at::Tensor faces = at::zeros({ntris, 3}, opt_long);
-    torch::Tensor ids = torch::zeros({ntris}, opt_long);
+    at::Tensor ids = at::zeros({ntris}, opt_long);
    return std::make_tuple(verts, faces, ids);
  }
  // Execute "CompactVoxelsKernel" kernel to compress voxels for accleration.
  // This allows us to run triangle generation on only the occupied voxels.
-  auto d_compVoxelArray = torch::zeros({activeVoxels}, opt);
+  auto d_compVoxelArray = at::zeros({activeVoxels}, opt);
  CompactVoxelsKernel<<<grid, threads, 0, stream>>>(
      d_compVoxelArray.packed_accessor32<int, 1, at::RestrictPtrTraits>(),
      d_voxelOccupied.packed_accessor32<int, 1, at::RestrictPtrTraits>(),
@ -519,7 +515,7 @@ std::tuple<at::Tensor, at::Tensor, at::Tensor> MarchingCubesCuda(
  cudaDeviceSynchronize();
  // Scan d_voxelVerts array to generate offsets of vertices for each voxel
-  auto d_voxelVertsScan = torch::zeros({numVoxels}, opt);
+  auto d_voxelVertsScan = at::zeros({numVoxels}, opt);
  ThrustScanWrapper(
      d_voxelVertsScan.data_ptr<int>(),
      d_voxelVerts.data_ptr<int>(),
@ -533,10 +529,10 @@ std::tuple<at::Tensor, at::Tensor, at::Tensor> MarchingCubesCuda(
  // Execute "GenerateFacesKernel" kernel
  // This runs only on the occupied voxels.
  // It looks up the field values and generates the triangle data.
-  torch::Tensor verts = torch::zeros({totalVerts, 3}, vol.options());
+  at::Tensor verts = at::zeros({totalVerts, 3}, vol.options());
-  torch::Tensor faces = torch::zeros({totalVerts / 3, 3}, opt_long);
+  at::Tensor faces = at::zeros({totalVerts / 3, 3}, opt_long);
-  torch::Tensor ids = torch::zeros({totalVerts}, opt_long);
+  at::Tensor ids = at::zeros({totalVerts}, opt_long);
  dim3 grid2((activeVoxels + threads - 1) / threads, 1, 1);
  if (grid2.x > 65535) {