nn_parse.py - platform/external/pytorch - Git at Google

 import copy
 import re
 import common_with_cwrap
 import yaml
 from collections import OrderedDict, defaultdict

 try:
     # use faster C loader if available
     from yaml import CLoader as Loader
 except ImportError:
     from yaml import Loader


 # matches `name`, `params` in `name(params)`
 NAME_PARAM_REGEX = r'(\w+)\((.*)\)'


 def argument_to_declaration(param, func=None):
     arg = {}
     arg['type'], name = param.split(' ')
     if arg['type'] == 'Tensor':
         arg['type'] = 'THTensor*'
     elif arg['type'] == 'LongTensor':
         arg['type'] = 'THIndexTensor*'
     elif arg['type'] == 'Scalar':
         arg['type'] = 'accreal'

     match = re.match(r'IntList\[(\d+)\]', arg['type'])
     if match:
         arg['type'] = 'IntList'
         arg['size'] = int(match.group(1))

     if '=' in name:
         name, default = name.split('=')
         arg['optional'] = True
         arg['default'] = default
     arg['name'] = name

     if func is not None:
         default_inits = func.get('default_init', {})
         wrap_dims = func.get('wrap_dim', {})
         if name in default_inits:
             # non constexpr defaults
             arg['default_init'] = default_inits[name]
         if name in wrap_dims:
             arg['wrap_dim'] = wrap_dims[name]

     return arg


 def output_arguments(thnn_function):
     cname = thnn_function.name
     output_args = []
     for arg in thnn_function.arguments:
         name = arg.name
         if name == 'output' and 'updateOutput' in cname:
             output_args.append({'type': 'THTensor*', 'name': name, 'output': True})
         elif name in {'gradInput', 'gradWeight', 'gradBias'}:
             name = camel_to_snake(name)
             output_args.append({'type': 'THTensor*', 'name': name, 'output': True,
                                 'is_nullable': True})
         elif name == 'indices' and 'updateOutput' in cname:
             output_args.append({'type': 'THIndexTensor*', 'name': name, 'output': True})
     return output_args


 def get_return(args):
     indices = [str(idx) for idx, arg in enumerate(args) if arg.get('output')]
     return 'argument {}'.format(','.join(indices))


 ARGUMENT_MAPPINGS = {
     'k': 'kernel_size',
     'd': 'stride',
     'pad': 'padding',
     'p': 'padding',
     'o': 'output_size',
     'osize': 'output_size',
     'dilation': 'dilation',
     'adj': 'output_padding',
     'a': 'output_padding',
 }

 DIMENSION_OFFSET = {
     'width': -1,
     'height': -2,
     'W': -1,
     'H': -2,
     'T': -3,
 }

 SUBSTITUTIONS = {
     'weights': 'weight',
     'train': 'training',
     'val': 'value',
 }


 def get_dimensionality(cname):
     if 'Temporal' in cname:
         return 1
     elif 'Spatial' in cname:
         return 2
     elif 'Volumetric' in cname:
         return 3
     return None


 def camel_to_snake(name):
     # from https://stackoverflow.com/questions/1175208/elegant-python-function-to-convert-camelcase-to-snake-case
     s1 = re.sub('(.)([A-Z][a-z]+)', r'\1_\2', name)
     return re.sub('([a-z0-9])([A-Z])', r'\1_\2', s1).lower()


 def get_thnn_args(thnn_function, params):
     params_by_name = {p['name']: p for p in params}
     dimensionality = get_dimensionality(thnn_function.name)

     def arg_expr(prefix, suffix):
         # e.g kW, kH
         name = ARGUMENT_MAPPINGS[prefix]
         if name not in params_by_name:
             raise RuntimeError('missing arg "{}" in {}'.format(name, thnn_function.name))
         param = params_by_name[name]
         if param['type'] == 'IntList' and 'size' in param:
             name = name + '_'
         index = dimensionality + DIMENSION_OFFSET[suffix]
         expr = '{}[{}]'.format(name, index)
         return {'type': 'EXPRESSION', 'name': expr}

     thnn_args = []
     for arg in thnn_function.arguments:
         name = arg.name
         if name == 'state':
             continue
         aten_name = camel_to_snake(SUBSTITUTIONS.get(name, name))
         if aten_name in params_by_name:
             param = params_by_name[aten_name]
             if arg.is_optional:
                 param['is_nullable'] = True
             thnn_args.append(copy.deepcopy(param))
         elif name[-1] in DIMENSION_OFFSET and name[:-1] in ARGUMENT_MAPPINGS:
             # e.g kW, kH
             thnn_args.append(arg_expr(name[:-1], name[-1]))
         elif name == 'owidth' or name == 'oheight':
             thnn_args.append(arg_expr(name[0], name[1:]))
         elif name == 'scale':
             thnn_args.append({'type': 'EXPRESSION', 'name': '1'})
         else:
             raise RuntimeError("{}: can't find binding for '{}'"
                                .format(thnn_function.name, name))
     return thnn_args


 def remove_unused_args(args, thnn_args):
     """Returns the subset of args whose name appears in thnn_args"""
     def clean_name(name):
         name = name[:name.index('[')] if '[' in name else name
         if name.endswith('_'):
             name = name[:-1]
         return name
     uses = set([clean_name(arg['name']) for arg in thnn_args])
     uses.add('output_mask')
     args = [arg for arg in args if arg['name'] in uses]
     for arg in args:
         if 'default' in arg:
             del arg['default']
     return args


 def unique_args(argslist):
     result = []
     seen = set()
     for args in argslist:
         for arg in args:
             if arg['name'] in seen:
                 continue
             seen.add(arg['name'])
             result.append(arg)
     return result


 def function_info(name, arguments, cimpls, buffers, backends):
     """
     cimpls contains information use to call into THNN:
         cname: THNN function name
         arguments: arguments to functional call
         condition: [optional] guard around call
     """
     return {
         'mode': 'NN',
         'name': name,
         'types': ['Float', 'Double'],
         'arguments': arguments,
         'return': get_return(arguments),
         'buffers': buffers,
         'backends': backends,
         'cimpls': cimpls,
         'variants': ['function'],
     }


 def base_declaration(func, thnn_function, backends):
     """Creates the NN function without any buffers in it's signature"""
     name, params = re.match(NAME_PARAM_REGEX, func['name']).groups()
     params = params.split(', ')
     arguments = [argument_to_declaration(a, func) for a in params]
     arguments += output_arguments(thnn_function)
     buffers = [argument_to_declaration('Tensor ' + buf)
                for buf in func.get('buffers', [])]

     thnn_args = get_thnn_args(thnn_function, arguments + buffers)
     cimpl = {'cname': thnn_function.name, 'arguments': thnn_args}

     return function_info(name, arguments, [cimpl], buffers, backends)


 def forward_declaration(base, thnn_function):
     name = '{}_forward'.format(base['name'])

     arguments = [copy.deepcopy(arg) for arg in base['arguments']
                  if not arg.get('output')]

     arguments += base['buffers']
     arguments += output_arguments(thnn_function)

     thnn_args = get_thnn_args(thnn_function, arguments)
     arguments = remove_unused_args(arguments, thnn_args)
     cimpl = {'cname': thnn_function.name, 'arguments': thnn_args}

     return function_info(name, arguments, [cimpl], [], base['backends'])


 def backward_declaration(base, thnn_functions):
     name = '{}_backward'.format(base['name'])

     arguments = []
     arguments.append({'type': 'THTensor*', 'name': 'grad_output'})
     arguments += [copy.deepcopy(arg) for arg in base['arguments']]
     arguments += base['buffers']

     for arg in arguments:
         if 'output' in arg:
             del arg['output']

     arguments += unique_args([output_arguments(f) for f in thnn_functions])

     def initialize_output_arg(arg):
         # the mask array<bool, N> specifies which return values to compute
         arg['mask'] = True

         # grad_weight and grad_bias need to be resized and zeroed
         if arg['name'] == 'grad_weight':
             arg['resize'] = 'weight'
             arg['zero'] = True
         if arg['name'] == 'grad_bias':
             dim = 1 if 'transpose' in name else 0
             arg['resize'] = [('weight', dim)]
             arg['zero'] = True

     is_batch_norm_backward = '_backward' in thnn_functions[0].name
     if len(thnn_functions) > 1 or is_batch_norm_backward:
         for arg in arguments:
             if arg.get('output', False):
                 initialize_output_arg(arg)

     thnn_args = [get_thnn_args(f, arguments) for f in thnn_functions]
     arguments = remove_unused_args(arguments, unique_args(thnn_args))
     cimpls = []

     def get_condition(func):
         # only call into the THNN functions if the output args are not null
         if '_updateGradInput' in func.name:
             return 'grad_input_'
         if '_accGradParameters' in func.name:
             return 'grad_weight_'
         return None

     for func, args in zip(thnn_functions, thnn_args):
         cimpl = {'cname': func.name, 'arguments': args}
         if len(thnn_functions) > 1:
             cimpl['condition'] = get_condition(func)
         cimpls.append(cimpl)

     return function_info(name, arguments, cimpls, [], base['backends'])


 def parse_nn_yaml(filename):
     with open(filename, 'r') as f:
         return yaml.load(f, Loader=Loader)


 include_only = '(updateOutput|updateGradInput|accGradParameters|backward)$'
 exclude = 'LookupTable'


 def run(paths):
     function_backends = defaultdict(list)
     header_functions = OrderedDict()

     headers = [p for p in paths if p.endswith('.h')]
     yamls = [p for p in paths if p.endswith('.yaml')]

     for path in headers:
         backend = 'CUDA' if re.search('THCU', path) else 'CPU'
         for func in common_with_cwrap.parse_header(path):
             if re.search(include_only, func.name) is None or re.search(exclude, func.name) is not None:
                 continue
             function_backends[func.name].append(backend)
             if func.name not in header_functions:
                 header_functions[func.name] = func

     bwd_suffixes = ['_updateGradInput', '_accGradParameters', '_backward']

     declarations = []
     for path in yamls:
         for func in parse_nn_yaml(path):
             cname = func['cname']
             backends = function_backends[cname + '_updateOutput']

             fwd_function = header_functions[cname + '_updateOutput']
             bwd_functions = []
             for suffix in bwd_suffixes:
                 if cname + suffix in header_functions:
                     bwd_functions.append(header_functions[cname + suffix])

             base = base_declaration(func, fwd_function, backends)

             declarations.append(base)
             declarations.append(forward_declaration(base, fwd_function))
             declarations.append(backward_declaration(base, bwd_functions))

     return declarations
	import copy
	import re
	import common_with_cwrap
	import yaml
	from collections import OrderedDict, defaultdict

	try:
	# use faster C loader if available
	from yaml import CLoader as Loader
	except ImportError:
	from yaml import Loader


	# matches `name`, `params` in `name(params)`
	NAME_PARAM_REGEX = r'(\w+)\((.*)\)'


	def argument_to_declaration(param, func=None):
	arg = {}
	arg['type'], name = param.split(' ')
	if arg['type'] == 'Tensor':
	arg['type'] = 'THTensor*'
	elif arg['type'] == 'LongTensor':
	arg['type'] = 'THIndexTensor*'
	elif arg['type'] == 'Scalar':
	arg['type'] = 'accreal'

	match = re.match(r'IntList\[(\d+)\]', arg['type'])
	if match:
	arg['type'] = 'IntList'
	arg['size'] = int(match.group(1))

	if '=' in name:
	name, default = name.split('=')
	arg['optional'] = True
	arg['default'] = default
	arg['name'] = name

	if func is not None:
	default_inits = func.get('default_init', {})
	wrap_dims = func.get('wrap_dim', {})
	if name in default_inits:
	# non constexpr defaults
	arg['default_init'] = default_inits[name]
	if name in wrap_dims:
	arg['wrap_dim'] = wrap_dims[name]

	return arg


	def output_arguments(thnn_function):
	cname = thnn_function.name
	output_args = []
	for arg in thnn_function.arguments:
	name = arg.name
	if name == 'output' and 'updateOutput' in cname:
	output_args.append({'type': 'THTensor*', 'name': name, 'output': True})
	elif name in {'gradInput', 'gradWeight', 'gradBias'}:
	name = camel_to_snake(name)
	output_args.append({'type': 'THTensor*', 'name': name, 'output': True,
	'is_nullable': True})
	elif name == 'indices' and 'updateOutput' in cname:
	output_args.append({'type': 'THIndexTensor*', 'name': name, 'output': True})
	return output_args


	def get_return(args):
	indices = [str(idx) for idx, arg in enumerate(args) if arg.get('output')]
	return 'argument {}'.format(','.join(indices))


	ARGUMENT_MAPPINGS = {
	'k': 'kernel_size',
	'd': 'stride',
	'pad': 'padding',
	'p': 'padding',
	'o': 'output_size',
	'osize': 'output_size',
	'dilation': 'dilation',
	'adj': 'output_padding',
	'a': 'output_padding',
	}

	DIMENSION_OFFSET = {
	'width': -1,
	'height': -2,
	'W': -1,
	'H': -2,
	'T': -3,
	}

	SUBSTITUTIONS = {
	'weights': 'weight',
	'train': 'training',
	'val': 'value',
	}


	def get_dimensionality(cname):
	if 'Temporal' in cname:
	return 1
	elif 'Spatial' in cname:
	return 2
	elif 'Volumetric' in cname:
	return 3
	return None


	def camel_to_snake(name):
	# from https://stackoverflow.com/questions/1175208/elegant-python-function-to-convert-camelcase-to-snake-case
	s1 = re.sub('(.)([A-Z][a-z]+)', r'\1_\2', name)
	return re.sub('([a-z0-9])([A-Z])', r'\1_\2', s1).lower()


	def get_thnn_args(thnn_function, params):
	params_by_name = {p['name']: p for p in params}
	dimensionality = get_dimensionality(thnn_function.name)

	def arg_expr(prefix, suffix):
	# e.g kW, kH
	name = ARGUMENT_MAPPINGS[prefix]
	if name not in params_by_name:
	raise RuntimeError('missing arg "{}" in {}'.format(name, thnn_function.name))
	param = params_by_name[name]
	if param['type'] == 'IntList' and 'size' in param:
	name = name + '_'
	index = dimensionality + DIMENSION_OFFSET[suffix]
	expr = '{}[{}]'.format(name, index)
	return {'type': 'EXPRESSION', 'name': expr}

	thnn_args = []
	for arg in thnn_function.arguments:
	name = arg.name
	if name == 'state':
	continue
	aten_name = camel_to_snake(SUBSTITUTIONS.get(name, name))
	if aten_name in params_by_name:
	param = params_by_name[aten_name]
	if arg.is_optional:
	param['is_nullable'] = True
	thnn_args.append(copy.deepcopy(param))
	elif name[-1] in DIMENSION_OFFSET and name[:-1] in ARGUMENT_MAPPINGS:
	# e.g kW, kH
	thnn_args.append(arg_expr(name[:-1], name[-1]))
	elif name == 'owidth' or name == 'oheight':
	thnn_args.append(arg_expr(name[0], name[1:]))
	elif name == 'scale':
	thnn_args.append({'type': 'EXPRESSION', 'name': '1'})
	else:
	raise RuntimeError("{}: can't find binding for '{}'"
	.format(thnn_function.name, name))
	return thnn_args


	def remove_unused_args(args, thnn_args):
	"""Returns the subset of args whose name appears in thnn_args"""
	def clean_name(name):
	name = name[:name.index('[')] if '[' in name else name
	if name.endswith('_'):
	name = name[:-1]
	return name
	uses = set([clean_name(arg['name']) for arg in thnn_args])
	uses.add('output_mask')
	args = [arg for arg in args if arg['name'] in uses]
	for arg in args:
	if 'default' in arg:
	del arg['default']
	return args


	def unique_args(argslist):
	result = []
	seen = set()
	for args in argslist:
	for arg in args:
	if arg['name'] in seen:
	continue
	seen.add(arg['name'])
	result.append(arg)
	return result


	def function_info(name, arguments, cimpls, buffers, backends):
	"""
	cimpls contains information use to call into THNN:
	cname: THNN function name
	arguments: arguments to functional call
	condition: [optional] guard around call
	"""
	return {
	'mode': 'NN',
	'name': name,
	'types': ['Float', 'Double'],
	'arguments': arguments,
	'return': get_return(arguments),
	'buffers': buffers,
	'backends': backends,
	'cimpls': cimpls,
	'variants': ['function'],
	}


	def base_declaration(func, thnn_function, backends):
	"""Creates the NN function without any buffers in it's signature"""
	name, params = re.match(NAME_PARAM_REGEX, func['name']).groups()
	params = params.split(', ')
	arguments = [argument_to_declaration(a, func) for a in params]
	arguments += output_arguments(thnn_function)
	buffers = [argument_to_declaration('Tensor ' + buf)
	for buf in func.get('buffers', [])]

	thnn_args = get_thnn_args(thnn_function, arguments + buffers)
	cimpl = {'cname': thnn_function.name, 'arguments': thnn_args}

	return function_info(name, arguments, [cimpl], buffers, backends)


	def forward_declaration(base, thnn_function):
	name = '{}_forward'.format(base['name'])

	arguments = [copy.deepcopy(arg) for arg in base['arguments']
	if not arg.get('output')]

	arguments += base['buffers']
	arguments += output_arguments(thnn_function)

	thnn_args = get_thnn_args(thnn_function, arguments)
	arguments = remove_unused_args(arguments, thnn_args)
	cimpl = {'cname': thnn_function.name, 'arguments': thnn_args}

	return function_info(name, arguments, [cimpl], [], base['backends'])


	def backward_declaration(base, thnn_functions):
	name = '{}_backward'.format(base['name'])

	arguments = []
	arguments.append({'type': 'THTensor*', 'name': 'grad_output'})
	arguments += [copy.deepcopy(arg) for arg in base['arguments']]
	arguments += base['buffers']

	for arg in arguments:
	if 'output' in arg:
	del arg['output']

	arguments += unique_args([output_arguments(f) for f in thnn_functions])

	def initialize_output_arg(arg):
	# the mask array<bool, N> specifies which return values to compute
	arg['mask'] = True

	# grad_weight and grad_bias need to be resized and zeroed
	if arg['name'] == 'grad_weight':
	arg['resize'] = 'weight'
	arg['zero'] = True
	if arg['name'] == 'grad_bias':
	dim = 1 if 'transpose' in name else 0
	arg['resize'] = [('weight', dim)]
	arg['zero'] = True

	is_batch_norm_backward = '_backward' in thnn_functions[0].name
	if len(thnn_functions) > 1 or is_batch_norm_backward:
	for arg in arguments:
	if arg.get('output', False):
	initialize_output_arg(arg)

	thnn_args = [get_thnn_args(f, arguments) for f in thnn_functions]
	arguments = remove_unused_args(arguments, unique_args(thnn_args))
	cimpls = []

	def get_condition(func):
	# only call into the THNN functions if the output args are not null
	if '_updateGradInput' in func.name:
	return 'grad_input_'
	if '_accGradParameters' in func.name:
	return 'grad_weight_'
	return None

	for func, args in zip(thnn_functions, thnn_args):
	cimpl = {'cname': func.name, 'arguments': args}
	if len(thnn_functions) > 1:
	cimpl['condition'] = get_condition(func)
	cimpls.append(cimpl)

	return function_info(name, arguments, cimpls, [], base['backends'])


	def parse_nn_yaml(filename):
	with open(filename, 'r') as f:
	return yaml.load(f, Loader=Loader)


	include_only = '(updateOutput\|updateGradInput\|accGradParameters\|backward)$'
	exclude = 'LookupTable'


	def run(paths):
	function_backends = defaultdict(list)
	header_functions = OrderedDict()

	headers = [p for p in paths if p.endswith('.h')]
	yamls = [p for p in paths if p.endswith('.yaml')]

	for path in headers:
	backend = 'CUDA' if re.search('THCU', path) else 'CPU'
	for func in common_with_cwrap.parse_header(path):
	if re.search(include_only, func.name) is None or re.search(exclude, func.name) is not None:
	continue
	function_backends[func.name].append(backend)
	if func.name not in header_functions:
	header_functions[func.name] = func

	bwd_suffixes = ['_updateGradInput', '_accGradParameters', '_backward']

	declarations = []
	for path in yamls:
	for func in parse_nn_yaml(path):
	cname = func['cname']
	backends = function_backends[cname + '_updateOutput']

	fwd_function = header_functions[cname + '_updateOutput']
	bwd_functions = []
	for suffix in bwd_suffixes:
	if cname + suffix in header_functions:
	bwd_functions.append(header_functions[cname + suffix])

	base = base_declaration(func, fwd_function, backends)

	declarations.append(base)
	declarations.append(forward_declaration(base, fwd_function))
	declarations.append(backward_declaration(base, bwd_functions))

	return declarations