caffe2/sgd/learning_rate_op.cc - platform/external/pytorch - Git at Google

 #include "caffe2/sgd/learning_rate_op.h"

 namespace caffe2 {
 REGISTER_CPU_OPERATOR(LearningRate, LearningRateOp<float, CPUContext>);

 OPERATOR_SCHEMA(LearningRate)
     .NumInputs(1)
     .NumOutputs(1)
     .SetDoc(R"DOC(
 Learning rate is a decreasing function of time. With low learning rates the
 improvements will be linear. With high learning rates they will start to look
 more exponential. Learning rate is controlled by the following arguments:


 Required:
  `iterations`
  `base_lr`: base learning rate
  `policy`: this controls how the learning rate is applied, options are:
    `fixed`
    `step`: uses `stepsize`, `gamma`
    `exp`: uses `gamma`
    `inv`: uses `gamma`, `power`
    `linearWarmup`: uses `start_multiplier`, `num_iter`
    `constantWarmup`: uses `multiplier`, `num_iter`
    `alter`: uses  `active_first`, `active_period`, `inactive_period`
    `hill`: uses those in both `linearWarmup` and `inv`, plus `end_multiplier`
    `composite`: uses `sub_policy_num_iters` and additional args with format
    sub_policy_{sub_policy_index}_{sub_policy_arg}, for example:
    sub_policy_0_policy: "exp", sub_policy_0_gamma: 0.99,
    sub_policy_0_lr_scale: 1.2
    sub_policy_0_policy: "fixed", sub_policy_0_lr_scale: 1.0
    sub_policy_num_iters: [1000, 1000]

 Optional:
   `stepsize`: defaults to 0
   `gamma`: defaults to 0
   `power`: defaults to 0
   `num_iter`: defaults to 0
   `start_multiplier`: defaults to 0
   `multiplier`: defaults to 0.5


 Usage:
   train_net.LearningRate(*iterations*, "*label*", base_lr=*float*,
                          policy="policy_name", stepsize=*int*, gamma=*float*)


 Example usage:
   train_net.LearningRate(200, "LR", base_lr=-0.1,
                          policy="step", stepsize=20, gamma=0.9)
 )DOC")
     .Arg("base_lr", "(float, required) base learning rate")
     .Arg("policy", "(float, default 1.0) strategy for gamma enforcement")
     .Arg("power", "(float, default 1.0) used only for inv policy type")
     .Arg("gamma", "(float, default 1.0) momentum of change")
     .Arg("stepsize", "(float, default 1.0) sampling rate on iterations")
     .Arg("active_first", "(boolean, default True) in alter policy")
     .Arg("active_period", "(int64_t, required) in alter policy")
     .Arg("inactive_period", "(int64_t, required) in alter policy")
     .Arg(
         "max_iter",
         "(int, default -1) maximum iterations in this training run")
     .Arg(
         "num_iter",
         "(int, default 0) number of iterations over which to warmup lr")
     .Arg(
         "start_multiplier",
         "(float, default 0) starting multiplier for learning rate")
     .Arg(
         "end_multiplier",
         "(float, default 0) end multiplier for learning rate")
     .Arg(
         "multiplier",
         "(float, default 0.5) constant multiplier for learning rate")
     .Arg(
         "sub_policy_num_iters",
         "(int array, default empty) number of iterations for each sub learning rate policy in composite policy")
     .Input(0, "input", "description needed")
     .Output(0, "output", "description needed")
     .DeviceInferenceFunction([](const OperatorDef& def) {
       return std::make_pair(
           std::vector<DeviceOption>{DeviceOption()},
           std::vector<DeviceOption>{def.device_option()});
     });

 NO_GRADIENT(LearningRate);
 }  // namespace caffe2
	#include "caffe2/sgd/learning_rate_op.h"

	namespace caffe2 {
	REGISTER_CPU_OPERATOR(LearningRate, LearningRateOp<float, CPUContext>);

	OPERATOR_SCHEMA(LearningRate)
	.NumInputs(1)
	.NumOutputs(1)
	.SetDoc(R"DOC(
	Learning rate is a decreasing function of time. With low learning rates the
	improvements will be linear. With high learning rates they will start to look
	more exponential. Learning rate is controlled by the following arguments:


	Required:
	`iterations`
	`base_lr`: base learning rate
	`policy`: this controls how the learning rate is applied, options are:
	`fixed`
	`step`: uses `stepsize`, `gamma`
	`exp`: uses `gamma`
	`inv`: uses `gamma`, `power`
	`linearWarmup`: uses `start_multiplier`, `num_iter`
	`constantWarmup`: uses `multiplier`, `num_iter`
	`alter`: uses `active_first`, `active_period`, `inactive_period`
	`hill`: uses those in both `linearWarmup` and `inv`, plus `end_multiplier`
	`composite`: uses `sub_policy_num_iters` and additional args with format
	sub_policy_{sub_policy_index}_{sub_policy_arg}, for example:
	sub_policy_0_policy: "exp", sub_policy_0_gamma: 0.99,
	sub_policy_0_lr_scale: 1.2
	sub_policy_0_policy: "fixed", sub_policy_0_lr_scale: 1.0
	sub_policy_num_iters: [1000, 1000]

	Optional:
	`stepsize`: defaults to 0
	`gamma`: defaults to 0
	`power`: defaults to 0
	`num_iter`: defaults to 0
	`start_multiplier`: defaults to 0
	`multiplier`: defaults to 0.5


	Usage:
	train_net.LearningRate(iterations, "label", base_lr=float,
	policy="policy_name", stepsize=int, gamma=float)


	Example usage:
	train_net.LearningRate(200, "LR", base_lr=-0.1,
	policy="step", stepsize=20, gamma=0.9)
	)DOC")
	.Arg("base_lr", "(float, required) base learning rate")
	.Arg("policy", "(float, default 1.0) strategy for gamma enforcement")
	.Arg("power", "(float, default 1.0) used only for inv policy type")
	.Arg("gamma", "(float, default 1.0) momentum of change")
	.Arg("stepsize", "(float, default 1.0) sampling rate on iterations")
	.Arg("active_first", "(boolean, default True) in alter policy")
	.Arg("active_period", "(int64_t, required) in alter policy")
	.Arg("inactive_period", "(int64_t, required) in alter policy")
	.Arg(
	"max_iter",
	"(int, default -1) maximum iterations in this training run")
	.Arg(
	"num_iter",
	"(int, default 0) number of iterations over which to warmup lr")
	.Arg(
	"start_multiplier",
	"(float, default 0) starting multiplier for learning rate")
	.Arg(
	"end_multiplier",
	"(float, default 0) end multiplier for learning rate")
	.Arg(
	"multiplier",
	"(float, default 0.5) constant multiplier for learning rate")
	.Arg(
	"sub_policy_num_iters",
	"(int array, default empty) number of iterations for each sub learning rate policy in composite policy")
	.Input(0, "input", "description needed")
	.Output(0, "output", "description needed")
	.DeviceInferenceFunction([](const OperatorDef& def) {
	return std::make_pair(
	std::vector<DeviceOption>{DeviceOption()},
	std::vector<DeviceOption>{def.device_option()});
	});

	NO_GRADIENT(LearningRate);
	} // namespace caffe2