THCAllocator.c - platform/external/pytorch - Git at Google

 #include "THCAllocator.h"

 static void *THCudaHostAllocator_malloc(void* ctx, ptrdiff_t size) {
   void* ptr;

   if (size < 0) THError("Invalid memory size: %ld", size);

   if (size == 0) return NULL;

   THCudaCheck(cudaMallocHost(&ptr, size));

   return ptr;
 }

 static void THCudaHostAllocator_free(void* ctx, void* ptr) {
   if (!ptr) return;

   THCudaCheck(cudaFreeHost(ptr));
 }

 void THCAllocator_init(THCState *state) {
   state->cudaHostAllocator->malloc = &THCudaHostAllocator_malloc;
   state->cudaHostAllocator->realloc = NULL;
   state->cudaHostAllocator->free = &THCudaHostAllocator_free;
 }

 static cudaError_t THCIpcAllocator_malloc(void* ctx, void** devPtr, size_t size, cudaStream_t stream)
 {
   THError("THCIpcAllocator.malloc() not supported");
   return cudaSuccess;
 }

 static cudaError_t THCIpcAllocator_free(void* ctx, void* devPtr)
 {
   return cudaIpcCloseMemHandle(devPtr);
 }

 THCDeviceAllocator THCIpcAllocator = {
   &THCIpcAllocator_malloc,
   NULL,
   &THCIpcAllocator_free,
   NULL,
   NULL
 };

 static void *THCUVAAllocator_alloc(void* ctx, ptrdiff_t size) {
   if (size < 0) THError("Invalid memory size: %ld", size);

   if (size == 0) return NULL;

   // See J.1.1 of the CUDA_C_Programming_Guide.pdf for UVA and coherence rules
   // on various compute capabilities.
   void* ptr;
   THCudaCheck(cudaMallocManaged(&ptr, size, cudaMemAttachGlobal));
   return ptr;
 }

 static void THCUVAAllocator_free(void* ctx, void* ptr) {
   if (!ptr) return;
   THCudaCheck(cudaFree(ptr));
 }

 void THCUVAAllocator_init(THAllocator *cudaUVAAllocator) {
   cudaUVAAllocator->malloc = &THCUVAAllocator_alloc;
   cudaUVAAllocator->realloc = NULL;
   cudaUVAAllocator->free = &THCUVAAllocator_free;
 }
	#include "THCAllocator.h"

	static void THCudaHostAllocator_malloc(void ctx, ptrdiff_t size) {
	void* ptr;

	if (size < 0) THError("Invalid memory size: %ld", size);

	if (size == 0) return NULL;

	THCudaCheck(cudaMallocHost(&ptr, size));

	return ptr;
	}

	static void THCudaHostAllocator_free(void* ctx, void* ptr) {
	if (!ptr) return;

	THCudaCheck(cudaFreeHost(ptr));
	}

	void THCAllocator_init(THCState *state) {
	state->cudaHostAllocator->malloc = &THCudaHostAllocator_malloc;
	state->cudaHostAllocator->realloc = NULL;
	state->cudaHostAllocator->free = &THCudaHostAllocator_free;
	}

	static cudaError_t THCIpcAllocator_malloc(void* ctx, void** devPtr, size_t size, cudaStream_t stream)
	{
	THError("THCIpcAllocator.malloc() not supported");
	return cudaSuccess;
	}

	static cudaError_t THCIpcAllocator_free(void* ctx, void* devPtr)
	{
	return cudaIpcCloseMemHandle(devPtr);
	}

	THCDeviceAllocator THCIpcAllocator = {
	&THCIpcAllocator_malloc,
	NULL,
	&THCIpcAllocator_free,
	NULL,
	NULL
	};

	static void THCUVAAllocator_alloc(void ctx, ptrdiff_t size) {
	if (size < 0) THError("Invalid memory size: %ld", size);

	if (size == 0) return NULL;

	// See J.1.1 of the CUDA_C_Programming_Guide.pdf for UVA and coherence rules
	// on various compute capabilities.
	void* ptr;
	THCudaCheck(cudaMallocManaged(&ptr, size, cudaMemAttachGlobal));
	return ptr;
	}

	static void THCUVAAllocator_free(void* ctx, void* ptr) {
	if (!ptr) return;
	THCudaCheck(cudaFree(ptr));
	}

	void THCUVAAllocator_init(THAllocator *cudaUVAAllocator) {
	cudaUVAAllocator->malloc = &THCUVAAllocator_alloc;
	cudaUVAAllocator->realloc = NULL;
	cudaUVAAllocator->free = &THCUVAAllocator_free;
	}