torch/legacy/nn/CosineEmbeddingCriterion.py - platform/external/pytorch - Git at Google

 import torch
 from .Criterion import Criterion


 class CosineEmbeddingCriterion(Criterion):

     def __init__(self, margin=0, sizeAverage=True):
         super(CosineEmbeddingCriterion, self).__init__()
         self.margin = margin
         self.sizeAverage = sizeAverage
         self.gradInput = [torch.Tensor(), torch.Tensor()]
         self.buffer = None
         self.w1 = None
         self.w22 = None
         self.w = None
         self.w32 = None
         self._outputs = None
         self._idx = None

     def updateOutput(self, input, y):
         input1, input2 = input[0], input[1]

         # keep backward compatibility
         if self.buffer is None:
             self.buffer = input1.new()
             self.w1 = input1.new()
             self.w22 = input1.new()
             self.w = input1.new()
             self.w32 = input1.new()
             self._outputs = input1.new()

             # comparison operators behave differently from cuda/c implementations
             # TODO: verify name
             if input1.type() == 'torch.cuda.FloatTensor':
                 self._idx = torch.cuda.ByteTensor()
             else:
                 self._idx = torch.ByteTensor()

         torch.mul(input1, input2, out=self.buffer)
         torch.sum(self.buffer, 1, out=self.w1, keepdim=True)

         epsilon = 1e-12
         torch.mul(input1, input1, out=self.buffer)
         torch.sum(self.buffer, 1, out=self.w22, keepdim=True).add_(epsilon)
         # self._outputs is also used as a temporary buffer
         self._outputs.resize_as_(self.w22).fill_(1)
         torch.div(self._outputs, self.w22, out=self.w22)
         self.w.resize_as_(self.w22).copy_(self.w22)

         torch.mul(input2, input2, out=self.buffer)
         torch.sum(self.buffer, 1, out=self.w32, keepdim=True).add_(epsilon)
         torch.div(self._outputs, self.w32, out=self.w32)
         self.w.mul_(self.w32)
         self.w.sqrt_()

         torch.mul(self.w1, self.w, out=self._outputs)
         self._outputs = self._outputs.select(1, 0)

         torch.eq(y, -1, out=self._idx)
         self._outputs[self._idx] = self._outputs[self._idx].add_(-self.margin).clamp_(min=0)
         torch.eq(y, 1, out=self._idx)
         self._outputs[self._idx] = self._outputs[self._idx].mul_(-1).add_(1)

         self.output = self._outputs.sum().item()

         if self.sizeAverage:
             self.output = self.output / y.size(0)

         return self.output

     def updateGradInput(self, input, y):
         v1 = input[0]
         v2 = input[1]

         gw1 = self.gradInput[0]
         gw2 = self.gradInput[1]
         gw1.resize_as_(v1).copy_(v2)
         gw2.resize_as_(v1).copy_(v1)

         torch.mul(self.w1, self.w22, out=self.buffer)
         gw1.addcmul_(-1, self.buffer.expand_as(v1), v1)
         gw1.mul_(self.w.expand_as(v1))

         torch.mul(self.w1, self.w32, out=self.buffer)
         gw2.addcmul_(-1, self.buffer.expand_as(v1), v2)
         gw2.mul_(self.w.expand_as(v1))

         # self._idx = self._outputs <= 0
         torch.le(self._outputs, 0, out=self._idx)
         self._idx = self._idx.view(-1, 1).expand(gw1.size())
         gw1[self._idx] = 0
         gw2[self._idx] = 0

         torch.eq(y, 1, out=self._idx)
         self._idx = self._idx.view(-1, 1).expand(gw2.size())
         gw1[self._idx] = gw1[self._idx].mul_(-1)
         gw2[self._idx] = gw2[self._idx].mul_(-1)

         if self.sizeAverage:
             gw1.div_(y.size(0))
             gw2.div_(y.size(0))

         return self.gradInput

     def type(self, type=None, tensorCache=None):
         if not type:
             return self._type

         self._idx = None
         super(CosineEmbeddingCriterion, self).type(type, tensorCache)
         # comparison operators behave differently from cuda/c implementations
         if type == 'torch.cuda.FloatTensor':
             self._idx = torch.cuda.ByteTensor()
         else:
             self._idx = torch.ByteTensor()

         return self
	import torch
	from .Criterion import Criterion


	class CosineEmbeddingCriterion(Criterion):

	def __init__(self, margin=0, sizeAverage=True):
	super(CosineEmbeddingCriterion, self).__init__()
	self.margin = margin
	self.sizeAverage = sizeAverage
	self.gradInput = [torch.Tensor(), torch.Tensor()]
	self.buffer = None
	self.w1 = None
	self.w22 = None
	self.w = None
	self.w32 = None
	self._outputs = None
	self._idx = None

	def updateOutput(self, input, y):
	input1, input2 = input[0], input[1]

	# keep backward compatibility
	if self.buffer is None:
	self.buffer = input1.new()
	self.w1 = input1.new()
	self.w22 = input1.new()
	self.w = input1.new()
	self.w32 = input1.new()
	self._outputs = input1.new()

	# comparison operators behave differently from cuda/c implementations
	# TODO: verify name
	if input1.type() == 'torch.cuda.FloatTensor':
	self._idx = torch.cuda.ByteTensor()
	else:
	self._idx = torch.ByteTensor()

	torch.mul(input1, input2, out=self.buffer)
	torch.sum(self.buffer, 1, out=self.w1, keepdim=True)

	epsilon = 1e-12
	torch.mul(input1, input1, out=self.buffer)
	torch.sum(self.buffer, 1, out=self.w22, keepdim=True).add_(epsilon)
	# self._outputs is also used as a temporary buffer
	self._outputs.resize_as_(self.w22).fill_(1)
	torch.div(self._outputs, self.w22, out=self.w22)
	self.w.resize_as_(self.w22).copy_(self.w22)

	torch.mul(input2, input2, out=self.buffer)
	torch.sum(self.buffer, 1, out=self.w32, keepdim=True).add_(epsilon)
	torch.div(self._outputs, self.w32, out=self.w32)
	self.w.mul_(self.w32)
	self.w.sqrt_()

	torch.mul(self.w1, self.w, out=self._outputs)
	self._outputs = self._outputs.select(1, 0)

	torch.eq(y, -1, out=self._idx)
	self._outputs[self._idx] = self._outputs[self._idx].add_(-self.margin).clamp_(min=0)
	torch.eq(y, 1, out=self._idx)
	self._outputs[self._idx] = self._outputs[self._idx].mul_(-1).add_(1)

	self.output = self._outputs.sum().item()

	if self.sizeAverage:
	self.output = self.output / y.size(0)

	return self.output

	def updateGradInput(self, input, y):
	v1 = input[0]
	v2 = input[1]

	gw1 = self.gradInput[0]
	gw2 = self.gradInput[1]
	gw1.resize_as_(v1).copy_(v2)
	gw2.resize_as_(v1).copy_(v1)

	torch.mul(self.w1, self.w22, out=self.buffer)
	gw1.addcmul_(-1, self.buffer.expand_as(v1), v1)
	gw1.mul_(self.w.expand_as(v1))

	torch.mul(self.w1, self.w32, out=self.buffer)
	gw2.addcmul_(-1, self.buffer.expand_as(v1), v2)
	gw2.mul_(self.w.expand_as(v1))

	# self._idx = self._outputs <= 0
	torch.le(self._outputs, 0, out=self._idx)
	self._idx = self._idx.view(-1, 1).expand(gw1.size())
	gw1[self._idx] = 0
	gw2[self._idx] = 0

	torch.eq(y, 1, out=self._idx)
	self._idx = self._idx.view(-1, 1).expand(gw2.size())
	gw1[self._idx] = gw1[self._idx].mul_(-1)
	gw2[self._idx] = gw2[self._idx].mul_(-1)

	if self.sizeAverage:
	gw1.div_(y.size(0))
	gw2.div_(y.size(0))

	return self.gradInput

	def type(self, type=None, tensorCache=None):
	if not type:
	return self._type

	self._idx = None
	super(CosineEmbeddingCriterion, self).type(type, tensorCache)
	# comparison operators behave differently from cuda/c implementations
	if type == 'torch.cuda.FloatTensor':
	self._idx = torch.cuda.ByteTensor()
	else:
	self._idx = torch.ByteTensor()

	return self