caffe2/operators/half_float_ops.cc - platform/external/pytorch - Git at Google

 #include "caffe2/operators/half_float_ops.h"
 #include <c10/util/Half.h>

 namespace caffe2 {

 template <>
 bool FloatToHalfOp<CPUContext>::RunOnDevice() {
   auto& input = Input(0);

   auto* output = Output(0, input.sizes(), at::dtype<at::Half>());
   const float* data = input.template data<float>();
   at::Half* out = output->template mutable_data<at::Half>();
   auto N = input.numel();

   for (size_t i = 0; i < N; i++) {
     out[i] = data[i];
   }

   return true;
 }

 template <>
 bool HalfToFloatOp<CPUContext>::RunOnDevice() {
   auto& input = Input(0);

   auto* output = Output(0, input.sizes(), at::dtype<float>());
   const at::Half* data = input.template data<at::Half>();
   float* out = output->template mutable_data<float>();
   auto N = input.numel();

   for (size_t i = 0; i < N; i++) {
     out[i] = data[i];
   }
   return true;
 }

 REGISTER_CPU_OPERATOR(FloatToHalf, FloatToHalfOp<CPUContext>);
 REGISTER_CPU_OPERATOR(HalfToFloat, HalfToFloatOp<CPUContext>);

 OPERATOR_SCHEMA(FloatToHalf)
     .NumInputs(1)
     .NumOutputs(1)
     .TensorInferenceFunction([](const OperatorDef& /* unused */,
                                 const vector<TensorShape>& in) {
       vector<TensorShape> out;
       const TensorShape& X = in[0];
       out.push_back(X);
       out[0].set_data_type(TensorProto_DataType_FLOAT16);

       return out;
     });

 OPERATOR_SCHEMA(HalfToFloat)
     .NumInputs(1)
     .NumOutputs(1)
     .TensorInferenceFunction([](const OperatorDef& /* unused */,
                                 const vector<TensorShape>& in) {
       vector<TensorShape> out;
       const TensorShape& X = in[0];
       out.push_back(X);
       out[0].set_data_type(TensorProto_DataType_FLOAT);

       return out;
     });

 bool Float16ConstantFillOp::RunOnDevice() {
   auto* output = Output(0, shape_, at::dtype<at::Half>());
   const float givenValue =
       this->template GetSingleArgument<float>("value", 0.0f);
   at::Half givenFp16Value = givenValue;

   if (output->numel()) {
     at::Half* out = output->template mutable_data<at::Half>();
     std::fill(out, out + output->numel(), givenFp16Value);
   }
   return true;
 }

 bool Float16UniformFillOp::RunOnDevice() {
   auto* output = Output(0, shape_, at::dtype<at::Half>());
   at::Half* out = output->template mutable_data<at::Half>();

   // Get a batch row by row and convert
   auto leading_dim_sz = output->size(0);
   int rowsz = output->numel() / output->size(0);

   vector<float> intermediate_data_;
   intermediate_data_.resize(rowsz);
   for (uint64_t i = 0; i < leading_dim_sz; i++) {
     math::RandUniform<float, CPUContext>(
         rowsz, min_, max_, intermediate_data_.data(), &context_);
     for (uint64_t j = 0; j < rowsz; j++) {
       out[i * rowsz + j] = intermediate_data_[j];
     }
   }
   return true;
 }

 REGISTER_CPU_OPERATOR(Float16ConstantFill, Float16ConstantFillOp);
 REGISTER_CPU_OPERATOR(Float16UniformFill, Float16UniformFillOp);
 OPERATOR_SCHEMA(Float16UniformFill)
     .NumInputs(0)
     .NumOutputs(1)
     .TensorInferenceFunction(Float16FillerTensorInference)
     .SetDoc(
         "Fills a half float tensor of a specified shape with"
         " values from a uniform distribution[min,max]")
     .Arg("shape", "Shape of the tensor")
     .Arg("min", "Minimim value to generate")
     .Arg("max", "Maximum value to generate");
 NO_GRADIENT(Float16UniformFill);

 OPERATOR_SCHEMA(Float16ConstantFill)
     .NumInputs(0)
     .NumOutputs(1)
     .TensorInferenceFunction(Float16FillerTensorInference)
     .Arg("value", "The value for the elements of the output tensor.")
     .Arg("shape", "The shape of the output tensor.")
     .Output(
         0,
         "output",
         "Output tensor of constant values specified by 'value'");

 class GetFloatToHalfGradient : public GradientMakerBase {
   using GradientMakerBase::GradientMakerBase;
   vector<OperatorDef> GetGradientDefs() override {
     return SingleGradientDef(
         "HalfToFloat", "", vector<string>{GO(0)}, vector<string>{GI(0)});
   }
 };
 REGISTER_GRADIENT(FloatToHalf, GetFloatToHalfGradient);

 class GetHalfToFloatGradient : public GradientMakerBase {
   using GradientMakerBase::GradientMakerBase;
   vector<OperatorDef> GetGradientDefs() override {
     return SingleGradientDef(
         "FloatToHalf", "", vector<string>{GO(0)}, vector<string>{GI(0)});
   }
 };
 REGISTER_GRADIENT(HalfToFloat, GetHalfToFloatGradient);
 NO_GRADIENT(Float16ConstantFill);
 } // namespace caffe2
	#include "caffe2/operators/half_float_ops.h"
	#include <c10/util/Half.h>

	namespace caffe2 {

	template <>
	bool FloatToHalfOp<CPUContext>::RunOnDevice() {
	auto& input = Input(0);

	auto* output = Output(0, input.sizes(), at::dtype<at::Half>());
	const float* data = input.template data<float>();
	at::Half* out = output->template mutable_data<at::Half>();
	auto N = input.numel();

	for (size_t i = 0; i < N; i++) {
	out[i] = data[i];
	}

	return true;
	}

	template <>
	bool HalfToFloatOp<CPUContext>::RunOnDevice() {
	auto& input = Input(0);

	auto* output = Output(0, input.sizes(), at::dtype<float>());
	const at::Half* data = input.template data<at::Half>();
	float* out = output->template mutable_data<float>();
	auto N = input.numel();

	for (size_t i = 0; i < N; i++) {
	out[i] = data[i];
	}
	return true;
	}

	REGISTER_CPU_OPERATOR(FloatToHalf, FloatToHalfOp<CPUContext>);
	REGISTER_CPU_OPERATOR(HalfToFloat, HalfToFloatOp<CPUContext>);

	OPERATOR_SCHEMA(FloatToHalf)
	.NumInputs(1)
	.NumOutputs(1)
	.TensorInferenceFunction([](const OperatorDef& /* unused */,
	const vector<TensorShape>& in) {
	vector<TensorShape> out;
	const TensorShape& X = in[0];
	out.push_back(X);
	out[0].set_data_type(TensorProto_DataType_FLOAT16);

	return out;
	});

	OPERATOR_SCHEMA(HalfToFloat)
	.NumInputs(1)
	.NumOutputs(1)
	.TensorInferenceFunction([](const OperatorDef& /* unused */,
	const vector<TensorShape>& in) {
	vector<TensorShape> out;
	const TensorShape& X = in[0];
	out.push_back(X);
	out[0].set_data_type(TensorProto_DataType_FLOAT);

	return out;
	});

	bool Float16ConstantFillOp::RunOnDevice() {
	auto* output = Output(0, shape_, at::dtype<at::Half>());
	const float givenValue =
	this->template GetSingleArgument<float>("value", 0.0f);
	at::Half givenFp16Value = givenValue;

	if (output->numel()) {
	at::Half* out = output->template mutable_data<at::Half>();
	std::fill(out, out + output->numel(), givenFp16Value);
	}
	return true;
	}

	bool Float16UniformFillOp::RunOnDevice() {
	auto* output = Output(0, shape_, at::dtype<at::Half>());
	at::Half* out = output->template mutable_data<at::Half>();

	// Get a batch row by row and convert
	auto leading_dim_sz = output->size(0);
	int rowsz = output->numel() / output->size(0);

	vector<float> intermediate_data_;
	intermediate_data_.resize(rowsz);
	for (uint64_t i = 0; i < leading_dim_sz; i++) {
	math::RandUniform<float, CPUContext>(
	rowsz, min_, max_, intermediate_data_.data(), &context_);
	for (uint64_t j = 0; j < rowsz; j++) {
	out[i * rowsz + j] = intermediate_data_[j];
	}
	}
	return true;
	}

	REGISTER_CPU_OPERATOR(Float16ConstantFill, Float16ConstantFillOp);
	REGISTER_CPU_OPERATOR(Float16UniformFill, Float16UniformFillOp);
	OPERATOR_SCHEMA(Float16UniformFill)
	.NumInputs(0)
	.NumOutputs(1)
	.TensorInferenceFunction(Float16FillerTensorInference)
	.SetDoc(
	"Fills a half float tensor of a specified shape with"
	" values from a uniform distribution[min,max]")
	.Arg("shape", "Shape of the tensor")
	.Arg("min", "Minimim value to generate")
	.Arg("max", "Maximum value to generate");
	NO_GRADIENT(Float16UniformFill);

	OPERATOR_SCHEMA(Float16ConstantFill)
	.NumInputs(0)
	.NumOutputs(1)
	.TensorInferenceFunction(Float16FillerTensorInference)
	.Arg("value", "The value for the elements of the output tensor.")
	.Arg("shape", "The shape of the output tensor.")
	.Output(
	0,
	"output",
	"Output tensor of constant values specified by 'value'");

	class GetFloatToHalfGradient : public GradientMakerBase {
	using GradientMakerBase::GradientMakerBase;
	vector<OperatorDef> GetGradientDefs() override {
	return SingleGradientDef(
	"HalfToFloat", "", vector<string>{GO(0)}, vector<string>{GI(0)});
	}
	};
	REGISTER_GRADIENT(FloatToHalf, GetFloatToHalfGradient);

	class GetHalfToFloatGradient : public GradientMakerBase {
	using GradientMakerBase::GradientMakerBase;
	vector<OperatorDef> GetGradientDefs() override {
	return SingleGradientDef(
	"FloatToHalf", "", vector<string>{GO(0)}, vector<string>{GI(0)});
	}
	};
	REGISTER_GRADIENT(HalfToFloat, GetHalfToFloatGradient);
	NO_GRADIENT(Float16ConstantFill);
	} // namespace caffe2