generic/SpatialMaxUnpooling.c - platform/external/pytorch - Git at Google

 #ifndef TH_GENERIC_FILE
 #define TH_GENERIC_FILE "generic/SpatialMaxUnpooling.c"
 #else

 static void THNN_(SpatialMaxUnpooling_updateOutput_frame)(real *input_p, real *output_p,
                                                       real *ind_p,
                                                       long nslices,
                                                       long iwidth, long iheight,
                                                       long owidth, long oheight)
 {
   long k;
 #pragma omp parallel for private(k)
   for (k = 0; k < nslices; k++)
   {
     real *output_p_k = output_p + k*owidth*oheight;
     real *input_p_k = input_p + k*iwidth*iheight;
     real *ind_p_k = ind_p + k*iwidth*iheight;

     long i, j, maxp;
     for(i = 0; i < iheight; i++)
     {
       for(j = 0; j < iwidth; j++)
       {
         maxp = ind_p_k[i*iwidth + j] - 1;  /* retrieve position of max */
         if(maxp<0 || maxp>=owidth*oheight){
             THError("invalid max index %d, owidth= %d, oheight= %d",maxp,owidth,oheight);
         }
         output_p_k[maxp] = input_p_k[i*iwidth + j]; /* update output */
       }
     }
   }
 }

 void THNN_(SpatialMaxUnpooling_updateOutput)(
     THNNState *state,
     THTensor *input,
     THTensor *output,
     THTensor *indices,
     int owidth, int oheight)
 {
   int dimw = 2;
   int dimh = 1;
   int nbatch = 1;
   int nslices;
   int iheight;
   int iwidth;
   real *input_data;
   real *output_data;
   real *indices_data;


   THArgCheck(input->nDimension == 3 || input->nDimension == 4 , 2, "3D or 4D (batch mode) tensor expected");
   if (!THTensor_(isSameSizeAs)(input, indices)){
     THError("Invalid input size w.r.t current indices size");
   }

   if (input->nDimension == 4)
   {
     nbatch = input->size[0];
     dimw++;
     dimh++;
   }

   /* sizes */
   nslices = input->size[dimh-1];
   iheight = input->size[dimh];
   iwidth = input->size[dimw];

   /* get contiguous input and indices */
   input = THTensor_(newContiguous)(input);
   indices = THTensor_(newContiguous)(indices);

   /* resize output */
   if (input->nDimension == 3)
   {
     THTensor_(resize3d)(output, nslices, oheight, owidth);
     THTensor_(zero)(output);

     input_data = THTensor_(data)(input);
     output_data = THTensor_(data)(output);
     indices_data = THTensor_(data)(indices);

     THNN_(SpatialMaxUnpooling_updateOutput_frame)(input_data, output_data,
                                               indices_data,
                                               nslices,
                                               iwidth, iheight,
                                               owidth, oheight);
   }
   else
   {
     long p;

     THTensor_(resize4d)(output, nbatch, nslices, oheight, owidth);
     THTensor_(zero)(output);

     input_data = THTensor_(data)(input);
     output_data = THTensor_(data)(output);
     indices_data = THTensor_(data)(indices);

 #pragma omp parallel for private(p)
     for (p = 0; p < nbatch; p++)
     {
       THNN_(SpatialMaxUnpooling_updateOutput_frame)(input_data+p*nslices*iwidth*iheight, output_data+p*nslices*owidth*oheight,
                                                 indices_data+p*nslices*iwidth*iheight,
                                                 nslices,
                                                 iwidth, iheight,
                                                 owidth, oheight);
     }
   }

   /* cleanup */
   THTensor_(free)(input);
   THTensor_(free)(indices);
 }

 static void THNN_(SpatialMaxUnpooling_updateGradInput_frame)(real *gradInput_p, real *gradOutput_p,
                                                          real *ind_p,
                                                          long nslices,
                                                          long iwidth, long iheight,
                                                          long owidth, long oheight)
 {
   long k;
 #pragma omp parallel for private(k)
   for (k = 0; k < nslices; k++)
   {
     real *gradInput_p_k = gradInput_p + k*iwidth*iheight;
     real *gradOutput_p_k = gradOutput_p + k*owidth*oheight;
     real *ind_p_k = ind_p + k*iwidth*iheight;

     long i, j, maxp;
     for(i = 0; i < iheight; i++)
     {
       for(j = 0; j < iwidth; j++)
       {
         maxp = ind_p_k[i*iwidth + j] - 1; /* retrieve position of max */
         if(maxp<0 || maxp>=owidth*oheight){
             THError("invalid max index %d, owidth= %d, oheight= %d",maxp,owidth,oheight);
         }
         gradInput_p_k[i*iwidth + j] = gradOutput_p_k[maxp]; /* update gradient */
       }
     }
   }
 }

 void THNN_(SpatialMaxUnpooling_updateGradInput)(
     THNNState *state,
     THTensor *input,
     THTensor *gradOutput,
     THTensor *gradInput,
     THTensor *indices,
     int owidth, int oheight)
 {
   int dimw = 2;
   int dimh = 1;
   int nbatch = 1;
   int nslices;
   int iheight;
   int iwidth;
   real *gradInput_data;
   real *gradOutput_data;
   real *indices_data;

   if (!THTensor_(isSameSizeAs)(input, indices)){
     THError("Invalid input size w.r.t current indices size");
   }

   /* get contiguous gradOutput and indices */
   gradOutput = THTensor_(newContiguous)(gradOutput);
   indices = THTensor_(newContiguous)(indices);

   /* resize */
   THTensor_(resizeAs)(gradInput, input);
   THTensor_(zero)(gradInput);

   if (input->nDimension == 4) {
     nbatch = input->size[0];
     dimw++;
     dimh++;
   }

   /* sizes */
   nslices = input->size[dimh-1];
   iheight = input->size[dimh];
   iwidth = input->size[dimw];

   if(owidth!=gradOutput->size[dimw] || oheight!=gradOutput->size[dimh]){
     THError("Inconsistent gradOutput size. oheight= %d, owidth= %d, gradOutput: %dx%d", oheight, owidth,gradOutput->size[dimh],gradOutput->size[dimw]);
   }

   /* get raw pointers */
   gradInput_data = THTensor_(data)(gradInput);
   gradOutput_data = THTensor_(data)(gradOutput);
   indices_data = THTensor_(data)(indices);

   /* backprop */
   if (input->nDimension == 3)
   {
     THNN_(SpatialMaxUnpooling_updateGradInput_frame)(gradInput_data, gradOutput_data,
                                                  indices_data,
                                                  nslices,
                                                  iwidth, iheight,
                                                  owidth, oheight);
   }
   else
   {
     long p;
 #pragma omp parallel for private(p)
     for (p = 0; p < nbatch; p++)
     {
       THNN_(SpatialMaxUnpooling_updateGradInput_frame)(gradInput_data+p*nslices*iwidth*iheight, gradOutput_data+p*nslices*owidth*oheight,
                                                    indices_data+p*nslices*iwidth*iheight,
                                                    nslices,
                                                    iwidth, iheight,
                                                    owidth, oheight);
     }
   }

   /* cleanup */
   THTensor_(free)(gradOutput);
   THTensor_(free)(indices);
 }

 #endif
	#ifndef TH_GENERIC_FILE
	#define TH_GENERIC_FILE "generic/SpatialMaxUnpooling.c"
	#else

	static void THNN_(SpatialMaxUnpooling_updateOutput_frame)(real input_p, real output_p,
	real *ind_p,
	long nslices,
	long iwidth, long iheight,
	long owidth, long oheight)
	{
	long k;
	#pragma omp parallel for private(k)
	for (k = 0; k < nslices; k++)
	{
	real output_p_k = output_p + kowidth*oheight;
	real input_p_k = input_p + kiwidth*iheight;
	real ind_p_k = ind_p + kiwidth*iheight;

	long i, j, maxp;
	for(i = 0; i < iheight; i++)
	{
	for(j = 0; j < iwidth; j++)
	{
	maxp = ind_p_k[iiwidth + j] - 1; / retrieve position of max */
	if(maxp<0 \|\| maxp>=owidth*oheight){
	THError("invalid max index %d, owidth= %d, oheight= %d",maxp,owidth,oheight);
	}
	output_p_k[maxp] = input_p_k[iiwidth + j]; / update output */
	}
	}
	}
	}

	void THNN_(SpatialMaxUnpooling_updateOutput)(
	THNNState *state,
	THTensor *input,
	THTensor *output,
	THTensor *indices,
	int owidth, int oheight)
	{
	int dimw = 2;
	int dimh = 1;
	int nbatch = 1;
	int nslices;
	int iheight;
	int iwidth;
	real *input_data;
	real *output_data;
	real *indices_data;


	THArgCheck(input->nDimension == 3 \|\| input->nDimension == 4 , 2, "3D or 4D (batch mode) tensor expected");
	if (!THTensor_(isSameSizeAs)(input, indices)){
	THError("Invalid input size w.r.t current indices size");
	}

	if (input->nDimension == 4)
	{
	nbatch = input->size[0];
	dimw++;
	dimh++;
	}

	/* sizes */
	nslices = input->size[dimh-1];
	iheight = input->size[dimh];
	iwidth = input->size[dimw];

	/* get contiguous input and indices */
	input = THTensor_(newContiguous)(input);
	indices = THTensor_(newContiguous)(indices);

	/* resize output */
	if (input->nDimension == 3)
	{
	THTensor_(resize3d)(output, nslices, oheight, owidth);
	THTensor_(zero)(output);

	input_data = THTensor_(data)(input);
	output_data = THTensor_(data)(output);
	indices_data = THTensor_(data)(indices);

	THNN_(SpatialMaxUnpooling_updateOutput_frame)(input_data, output_data,
	indices_data,
	nslices,
	iwidth, iheight,
	owidth, oheight);
	}
	else
	{
	long p;

	THTensor_(resize4d)(output, nbatch, nslices, oheight, owidth);
	THTensor_(zero)(output);

	input_data = THTensor_(data)(input);
	output_data = THTensor_(data)(output);
	indices_data = THTensor_(data)(indices);

	#pragma omp parallel for private(p)
	for (p = 0; p < nbatch; p++)
	{
	THNN_(SpatialMaxUnpooling_updateOutput_frame)(input_data+pnslicesiwidthiheight, output_data+pnslicesowidthoheight,
	indices_data+pnslicesiwidth*iheight,
	nslices,
	iwidth, iheight,
	owidth, oheight);
	}
	}

	/* cleanup */
	THTensor_(free)(input);
	THTensor_(free)(indices);
	}

	static void THNN_(SpatialMaxUnpooling_updateGradInput_frame)(real gradInput_p, real gradOutput_p,
	real *ind_p,
	long nslices,
	long iwidth, long iheight,
	long owidth, long oheight)
	{
	long k;
	#pragma omp parallel for private(k)
	for (k = 0; k < nslices; k++)
	{
	real gradInput_p_k = gradInput_p + kiwidth*iheight;
	real gradOutput_p_k = gradOutput_p + kowidth*oheight;
	real ind_p_k = ind_p + kiwidth*iheight;

	long i, j, maxp;
	for(i = 0; i < iheight; i++)
	{
	for(j = 0; j < iwidth; j++)
	{
	maxp = ind_p_k[iiwidth + j] - 1; / retrieve position of max */
	if(maxp<0 \|\| maxp>=owidth*oheight){
	THError("invalid max index %d, owidth= %d, oheight= %d",maxp,owidth,oheight);
	}
	gradInput_p_k[iiwidth + j] = gradOutput_p_k[maxp]; / update gradient */
	}
	}
	}
	}

	void THNN_(SpatialMaxUnpooling_updateGradInput)(
	THNNState *state,
	THTensor *input,
	THTensor *gradOutput,
	THTensor *gradInput,
	THTensor *indices,
	int owidth, int oheight)
	{
	int dimw = 2;
	int dimh = 1;
	int nbatch = 1;
	int nslices;
	int iheight;
	int iwidth;
	real *gradInput_data;
	real *gradOutput_data;
	real *indices_data;

	if (!THTensor_(isSameSizeAs)(input, indices)){
	THError("Invalid input size w.r.t current indices size");
	}

	/* get contiguous gradOutput and indices */
	gradOutput = THTensor_(newContiguous)(gradOutput);
	indices = THTensor_(newContiguous)(indices);

	/* resize */
	THTensor_(resizeAs)(gradInput, input);
	THTensor_(zero)(gradInput);

	if (input->nDimension == 4) {
	nbatch = input->size[0];
	dimw++;
	dimh++;
	}

	/* sizes */
	nslices = input->size[dimh-1];
	iheight = input->size[dimh];
	iwidth = input->size[dimw];

	if(owidth!=gradOutput->size[dimw] \|\| oheight!=gradOutput->size[dimh]){
	THError("Inconsistent gradOutput size. oheight= %d, owidth= %d, gradOutput: %dx%d", oheight, owidth,gradOutput->size[dimh],gradOutput->size[dimw]);
	}

	/* get raw pointers */
	gradInput_data = THTensor_(data)(gradInput);
	gradOutput_data = THTensor_(data)(gradOutput);
	indices_data = THTensor_(data)(indices);

	/* backprop */
	if (input->nDimension == 3)
	{
	THNN_(SpatialMaxUnpooling_updateGradInput_frame)(gradInput_data, gradOutput_data,
	indices_data,
	nslices,
	iwidth, iheight,
	owidth, oheight);
	}
	else
	{
	long p;
	#pragma omp parallel for private(p)
	for (p = 0; p < nbatch; p++)
	{
	THNN_(SpatialMaxUnpooling_updateGradInput_frame)(gradInput_data+pnslicesiwidthiheight, gradOutput_data+pnslicesowidthoheight,
	indices_data+pnslicesiwidth*iheight,
	nslices,
	iwidth, iheight,
	owidth, oheight);
	}
	}

	/* cleanup */
	THTensor_(free)(gradOutput);
	THTensor_(free)(indices);
	}

	#endif