src/backends/reference/RefWorkloadFactory.cpp - platform/external/armnn - Git at Google

 //
 // Copyright © 2017 Arm Ltd. All rights reserved.
 // SPDX-License-Identifier: MIT
 //
 #include <Layer.hpp>
 #include <backendsCommon/CpuTensorHandle.hpp>
 #include <backendsCommon/MemCopyWorkload.hpp>
 #include <backendsCommon/MemImportWorkload.hpp>
 #include <backendsCommon/MakeWorkloadHelper.hpp>
 #include "RefWorkloadFactory.hpp"
 #include "RefBackendId.hpp"
 #include "workloads/RefWorkloads.hpp"
 #include "RefTensorHandle.hpp"

 #include <boost/log/trivial.hpp>

 namespace armnn
 {

 namespace
 {
 static const BackendId s_Id{RefBackendId()};
 }
 template <typename F32Workload, typename U8Workload, typename QueueDescriptorType>
 std::unique_ptr<IWorkload> RefWorkloadFactory::MakeWorkload(const QueueDescriptorType& descriptor,
     const WorkloadInfo& info) const
 {
     return armnn::MakeWorkloadHelper<NullWorkload, F32Workload, U8Workload, NullWorkload, NullWorkload>(descriptor,
                                                                                                         info);
 }

 template <DataType ArmnnType>
 bool IsDataType(const WorkloadInfo& info)
 {
     auto checkType = [](const TensorInfo& tensorInfo) {return tensorInfo.GetDataType() == ArmnnType;};
     auto it = std::find_if(std::begin(info.m_InputTensorInfos), std::end(info.m_InputTensorInfos), checkType);
     if (it != std::end(info.m_InputTensorInfos))
     {
         return true;
     }
     it = std::find_if(std::begin(info.m_OutputTensorInfos), std::end(info.m_OutputTensorInfos), checkType);
     if (it != std::end(info.m_OutputTensorInfos))
     {
         return true;
     }
     return false;
 }

 bool IsFloat16(const WorkloadInfo& info)
 {
     return IsDataType<DataType::Float16>(info);
 }

 bool IsQSymm16(const WorkloadInfo& info)
 {
     return IsDataType<DataType::QuantisedSymm16>(info);
 }

 RefWorkloadFactory::RefWorkloadFactory(const std::shared_ptr<RefMemoryManager>& memoryManager)
     : m_MemoryManager(memoryManager)
 {
 }

 RefWorkloadFactory::RefWorkloadFactory()
     : m_MemoryManager(new RefMemoryManager())
 {
 }

 const BackendId& RefWorkloadFactory::GetBackendId() const
 {
     return s_Id;
 }

 bool RefWorkloadFactory::IsLayerSupported(const Layer& layer,
                                           Optional<DataType> dataType,
                                           std::string& outReasonIfUnsupported)
 {
     return IWorkloadFactory::IsLayerSupported(s_Id, layer, dataType, outReasonIfUnsupported);
 }

 std::unique_ptr<ITensorHandle> RefWorkloadFactory::CreateTensorHandle(const TensorInfo& tensorInfo,
                                                                       const bool IsMemoryManaged) const
 {
     // For Ref it is okay to make the TensorHandle memory managed as it can also store a pointer
     // to unmanaged memory. This also ensures memory alignment.
     return std::make_unique<RefTensorHandle>(tensorInfo, m_MemoryManager);
 }

 std::unique_ptr<ITensorHandle> RefWorkloadFactory::CreateTensorHandle(const TensorInfo& tensorInfo,
                                                                       DataLayout dataLayout,
                                                                       const bool IsMemoryManaged) const
 {
     // For Ref it is okay to make the TensorHandle memory managed as it can also store a pointer
     // to unmanaged memory. This also ensures memory alignment.
     return std::make_unique<RefTensorHandle>(tensorInfo, m_MemoryManager);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateInput(const InputQueueDescriptor& descriptor,
                                                            const WorkloadInfo& info) const
 {
     if (info.m_InputTensorInfos.empty() )
     {
         throw InvalidArgumentException("RefWorkloadFactory::CreateInput: Input cannot be zero length");
     }
     if (info.m_OutputTensorInfos.empty())
     {
         throw InvalidArgumentException("RefWorkloadFactory::CreateInput: Output cannot be zero length");
     }

     if (info.m_InputTensorInfos[0].GetNumBytes() != info.m_OutputTensorInfos[0].GetNumBytes())
     {
         throw InvalidArgumentException("RefWorkloadFactory::CreateInput: data input and output differ in byte count.");
     }

     return std::make_unique<CopyMemGenericWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateOutput(const OutputQueueDescriptor& descriptor,
                                                             const WorkloadInfo& info) const
 {
     if (info.m_InputTensorInfos.empty() )
     {
         throw InvalidArgumentException("RefWorkloadFactory::CreateOutput: Input cannot be zero length");
     }
     if (info.m_OutputTensorInfos.empty())
     {
         throw InvalidArgumentException("RefWorkloadFactory::CreateOutput: Output cannot be zero length");
     }
     if (info.m_InputTensorInfos[0].GetNumBytes() != info.m_OutputTensorInfos[0].GetNumBytes())
     {
         throw InvalidArgumentException("RefWorkloadFactory::CreateOutput: data input and output differ in byte count.");
     }

     return std::make_unique<CopyMemGenericWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateActivation(const ActivationQueueDescriptor& descriptor,
                                                                 const WorkloadInfo&              info) const
 {
     return std::make_unique<RefActivationWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateArgMinMax(const ArgMinMaxQueueDescriptor& descriptor,
                                                                const WorkloadInfo&              info) const
 {
     return std::make_unique<RefArgMinMaxWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateSoftmax(const SoftmaxQueueDescriptor& descriptor,
                                                              const WorkloadInfo&           info) const
 {
     return std::make_unique<RefSoftmaxWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateSplitter(const SplitterQueueDescriptor& descriptor,
                                                               const WorkloadInfo&            info) const
 {
     return std::make_unique<RefSplitterWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateMerger(const MergerQueueDescriptor& descriptor,
                                                                    const WorkloadInfo&          info) const
 {
     return CreateConcat(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateFullyConnected(
     const FullyConnectedQueueDescriptor& descriptor, const WorkloadInfo& info) const
 {
     return std::make_unique<RefFullyConnectedWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreatePermute(const PermuteQueueDescriptor& descriptor,
                                                                     const WorkloadInfo&           info) const
 {
     if (IsQSymm16(info))
     {
         return std::make_unique<RefPermuteQSymm16Workload>(descriptor, info);
     }
     return MakeWorkloadHelper<RefPermuteFloat16Workload, RefPermuteFloat32Workload, RefPermuteQAsymm8Workload,
         NullWorkload, NullWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreatePooling2d(const Pooling2dQueueDescriptor& descriptor,
                                                                       const WorkloadInfo&           info) const
 {
     return std::make_unique<RefPooling2dWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateConvolution2d(
     const Convolution2dQueueDescriptor& descriptor, const WorkloadInfo& info) const
 {
     return std::make_unique<RefConvolution2dWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateDepthToSpace(const DepthToSpaceQueueDescriptor& descriptor,
                                                                   const WorkloadInfo& info) const
 {
     return std::make_unique<RefDepthToSpaceWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateDepthwiseConvolution2d(
     const DepthwiseConvolution2dQueueDescriptor& descriptor, const WorkloadInfo& info) const
 {
     return std::make_unique<RefDepthwiseConvolution2dWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateDetectionPostProcess(
     const armnn::DetectionPostProcessQueueDescriptor& descriptor, const armnn::WorkloadInfo& info) const
 {
     return std::make_unique<RefDetectionPostProcessWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateNormalization(
     const NormalizationQueueDescriptor& descriptor, const WorkloadInfo& info) const
 {
     return std::make_unique<RefNormalizationWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateAddition(const AdditionQueueDescriptor& descriptor,
                                                                      const WorkloadInfo&            info) const
 {
     return std::make_unique<RefAdditionWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateMultiplication(
     const MultiplicationQueueDescriptor& descriptor, const WorkloadInfo& info) const
 {
     return std::make_unique<RefMultiplicationWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateBatchNormalization(
     const BatchNormalizationQueueDescriptor& descriptor, const WorkloadInfo& info) const
 {
     return std::make_unique<RefBatchNormalizationWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateMemCopy(const MemCopyQueueDescriptor& descriptor,
                                                                     const WorkloadInfo&        info) const
 {
     if (descriptor.m_Inputs.empty())
     {
         throw InvalidArgumentException("RefWorkloadFactory: CreateMemCopy() expected an input tensor.");
     }
     return std::make_unique<CopyMemGenericWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateMemImport(const MemImportQueueDescriptor& descriptor,
                                                                       const WorkloadInfo&        info) const
 {
     if (descriptor.m_Inputs.empty())
     {
         throw InvalidArgumentException("RefWorkloadFactory: CreateMemImport() expected an input tensor.");
     }
     return std::make_unique<ImportMemGenericWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateResize(const ResizeQueueDescriptor& descriptor,
                                                             const WorkloadInfo& info) const
 {
     return std::make_unique<RefResizeWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateResizeBilinear(const ResizeBilinearQueueDescriptor& descriptor,
                                                                     const WorkloadInfo& info) const
 {
     ResizeQueueDescriptor resizeDescriptor;
     resizeDescriptor.m_Parameters.m_Method       = ResizeMethod::Bilinear;
     resizeDescriptor.m_Parameters.m_DataLayout   = descriptor.m_Parameters.m_DataLayout;
     resizeDescriptor.m_Parameters.m_TargetWidth  = descriptor.m_Parameters.m_TargetWidth;
     resizeDescriptor.m_Parameters.m_TargetHeight = descriptor.m_Parameters.m_TargetHeight;

     return CreateResize(resizeDescriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateFakeQuantization(
     const FakeQuantizationQueueDescriptor& descriptor,
     const WorkloadInfo& info) const
 {
     return MakeWorkload<RefFakeQuantizationFloat32Workload, NullWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateL2Normalization(const L2NormalizationQueueDescriptor& descriptor,
     const WorkloadInfo& info) const
 {
     return std::make_unique<RefL2NormalizationWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateConcat(const ConcatQueueDescriptor& descriptor,
                                                                    const WorkloadInfo&          info) const
 {
     return std::make_unique<RefConcatWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateConstant(const ConstantQueueDescriptor& descriptor,
     const WorkloadInfo& info) const
 {
     return std::make_unique<RefConstantWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateReshape(const ReshapeQueueDescriptor& descriptor,
     const WorkloadInfo& info) const
 {
     return std::make_unique<RefReshapeWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateSpaceToBatchNd(const SpaceToBatchNdQueueDescriptor& descriptor,
     const WorkloadInfo& info) const
 {
     return std::make_unique<RefSpaceToBatchNdWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateSpaceToDepth(const armnn::SpaceToDepthQueueDescriptor& descriptor,
     const armnn::WorkloadInfo& info) const
 {
     return std::make_unique<RefSpaceToDepthWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateFloor(const FloorQueueDescriptor& descriptor,
                                                           const WorkloadInfo& info) const
 {
     return std::make_unique<RefFloorWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateLstm(const LstmQueueDescriptor& descriptor,
     const WorkloadInfo& info) const
 {
     return std::make_unique<RefLstmWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateConvertFp16ToFp32(
     const ConvertFp16ToFp32QueueDescriptor& descriptor,
     const WorkloadInfo& info) const
 {
     return std::make_unique<RefConvertFp16ToFp32Workload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateConvertFp32ToFp16(
     const ConvertFp32ToFp16QueueDescriptor& descriptor,
     const WorkloadInfo& info) const
 {
     return std::make_unique<RefConvertFp32ToFp16Workload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateDivision(
     const DivisionQueueDescriptor& descriptor, const WorkloadInfo& info) const
 {
     return std::make_unique<RefDivisionWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateSubtraction(
     const SubtractionQueueDescriptor& descriptor, const WorkloadInfo& info) const
 {
     return std::make_unique<RefSubtractionWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateMaximum(
     const MaximumQueueDescriptor& descriptor, const WorkloadInfo& info) const
 {
     return std::make_unique<RefMaximumWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateMean(
     const MeanQueueDescriptor& descriptor, const WorkloadInfo& info) const
 {
     return  std::make_unique<RefMeanWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateMinimum(
     const MinimumQueueDescriptor& descriptor, const WorkloadInfo& info) const
 {
     return std::make_unique<RefMinimumWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreatePad(const PadQueueDescriptor& descriptor,
                                                  const WorkloadInfo& info) const
 {
     if (IsQSymm16(info))
     {
         return std::make_unique<RefPadQSymm16Workload>(descriptor, info);
     }
     else if (IsFloat16(info))
     {
         return std::make_unique<RefPadFloat16Workload>(descriptor, info);
     }
     return MakeWorkload<RefPadFloat32Workload, RefPadQAsymm8Workload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateEqual(const EqualQueueDescriptor& descriptor,
                                                            const WorkloadInfo& info) const
 {
     return std::make_unique<RefEqualWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateBatchToSpaceNd(const BatchToSpaceNdQueueDescriptor& descriptor,
                                                                     const WorkloadInfo& info) const
 {
     return std::make_unique<RefBatchToSpaceNdWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateStridedSlice(const StridedSliceQueueDescriptor& descriptor,
                                                                   const WorkloadInfo& info) const
 {
     return std::make_unique<RefStridedSliceWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateGreater(const GreaterQueueDescriptor& descriptor,
                                                              const WorkloadInfo& info) const
 {
     return std::make_unique<RefGreaterWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateDebug(const DebugQueueDescriptor& descriptor,
                                                            const WorkloadInfo& info) const
 {
     if (IsQSymm16(info))
     {
         return std::make_unique<RefDebugQSymm16Workload>(descriptor, info);
     }
     return MakeWorkload<RefDebugFloat32Workload, RefDebugQAsymm8Workload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateRsqrt(const RsqrtQueueDescriptor& descriptor,
                                                            const WorkloadInfo& info) const
 {
     return std::make_unique<RefRsqrtWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateGather(const armnn::GatherQueueDescriptor& descriptor,
                                                             const armnn::WorkloadInfo& info) const
 {
     return std::make_unique<RefGatherWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreatePreCompiled(const PreCompiledQueueDescriptor& descriptor,
                                                                  const WorkloadInfo& info) const
 {
     return nullptr;
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateQuantize(const QuantizeQueueDescriptor& descriptor,
                                                               const WorkloadInfo& info) const
 {
     return std::make_unique<RefQuantizeWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateDequantize(const DequantizeQueueDescriptor& descriptor,
                                                                 const WorkloadInfo& info) const
 {
     return std::make_unique<RefDequantizeWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreatePrelu(const PreluQueueDescriptor& descriptor,
                                                            const WorkloadInfo& info) const
 {
     return std::make_unique<RefPreluWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateTransposeConvolution2d(
     const TransposeConvolution2dQueueDescriptor& descriptor,
     const WorkloadInfo& info) const
 {
     return std::make_unique<RefTransposeConvolution2dWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateStack(const StackQueueDescriptor& descriptor,
                                                            const WorkloadInfo& info) const
 {
     return std::make_unique<RefStackWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateAbs(const AbsQueueDescriptor& descriptor,
                                                          const WorkloadInfo& info) const
 {
     return std::make_unique<RefAbsWorkload>(descriptor, info);
 }

 std::unique_ptr<IWorkload> RefWorkloadFactory::CreateSlice(const SliceQueueDescriptor& descriptor,
                                                            const WorkloadInfo& info) const
 {
     return std::make_unique<RefSliceWorkload>(descriptor, info);
 }

 std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateInstanceNormalization(
     const InstanceNormalizationQueueDescriptor& descriptor, const WorkloadInfo& info) const
 {
     return std::make_unique<RefInstanceNormalizationWorkload>(descriptor, info);
 }

 } // namespace armnn
	//
	// Copyright © 2017 Arm Ltd. All rights reserved.
	// SPDX-License-Identifier: MIT
	//
	#include <Layer.hpp>
	#include <backendsCommon/CpuTensorHandle.hpp>
	#include <backendsCommon/MemCopyWorkload.hpp>
	#include <backendsCommon/MemImportWorkload.hpp>
	#include <backendsCommon/MakeWorkloadHelper.hpp>
	#include "RefWorkloadFactory.hpp"
	#include "RefBackendId.hpp"
	#include "workloads/RefWorkloads.hpp"
	#include "RefTensorHandle.hpp"

	#include <boost/log/trivial.hpp>

	namespace armnn
	{

	namespace
	{
	static const BackendId s_Id{RefBackendId()};
	}
	template <typename F32Workload, typename U8Workload, typename QueueDescriptorType>
	std::unique_ptr<IWorkload> RefWorkloadFactory::MakeWorkload(const QueueDescriptorType& descriptor,
	const WorkloadInfo& info) const
	{
	return armnn::MakeWorkloadHelper<NullWorkload, F32Workload, U8Workload, NullWorkload, NullWorkload>(descriptor,
	info);
	}

	template <DataType ArmnnType>
	bool IsDataType(const WorkloadInfo& info)
	{
	auto checkType = [](const TensorInfo& tensorInfo) {return tensorInfo.GetDataType() == ArmnnType;};
	auto it = std::find_if(std::begin(info.m_InputTensorInfos), std::end(info.m_InputTensorInfos), checkType);
	if (it != std::end(info.m_InputTensorInfos))
	{
	return true;
	}
	it = std::find_if(std::begin(info.m_OutputTensorInfos), std::end(info.m_OutputTensorInfos), checkType);
	if (it != std::end(info.m_OutputTensorInfos))
	{
	return true;
	}
	return false;
	}

	bool IsFloat16(const WorkloadInfo& info)
	{
	return IsDataType<DataType::Float16>(info);
	}

	bool IsQSymm16(const WorkloadInfo& info)
	{
	return IsDataType<DataType::QuantisedSymm16>(info);
	}

	RefWorkloadFactory::RefWorkloadFactory(const std::shared_ptr<RefMemoryManager>& memoryManager)
	: m_MemoryManager(memoryManager)
	{
	}

	RefWorkloadFactory::RefWorkloadFactory()
	: m_MemoryManager(new RefMemoryManager())
	{
	}

	const BackendId& RefWorkloadFactory::GetBackendId() const
	{
	return s_Id;
	}

	bool RefWorkloadFactory::IsLayerSupported(const Layer& layer,
	Optional<DataType> dataType,
	std::string& outReasonIfUnsupported)
	{
	return IWorkloadFactory::IsLayerSupported(s_Id, layer, dataType, outReasonIfUnsupported);
	}

	std::unique_ptr<ITensorHandle> RefWorkloadFactory::CreateTensorHandle(const TensorInfo& tensorInfo,
	const bool IsMemoryManaged) const
	{
	// For Ref it is okay to make the TensorHandle memory managed as it can also store a pointer
	// to unmanaged memory. This also ensures memory alignment.
	return std::make_unique<RefTensorHandle>(tensorInfo, m_MemoryManager);
	}

	std::unique_ptr<ITensorHandle> RefWorkloadFactory::CreateTensorHandle(const TensorInfo& tensorInfo,
	DataLayout dataLayout,
	const bool IsMemoryManaged) const
	{
	// For Ref it is okay to make the TensorHandle memory managed as it can also store a pointer
	// to unmanaged memory. This also ensures memory alignment.
	return std::make_unique<RefTensorHandle>(tensorInfo, m_MemoryManager);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateInput(const InputQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	if (info.m_InputTensorInfos.empty() )
	{
	throw InvalidArgumentException("RefWorkloadFactory::CreateInput: Input cannot be zero length");
	}
	if (info.m_OutputTensorInfos.empty())
	{
	throw InvalidArgumentException("RefWorkloadFactory::CreateInput: Output cannot be zero length");
	}

	if (info.m_InputTensorInfos[0].GetNumBytes() != info.m_OutputTensorInfos[0].GetNumBytes())
	{
	throw InvalidArgumentException("RefWorkloadFactory::CreateInput: data input and output differ in byte count.");
	}

	return std::make_unique<CopyMemGenericWorkload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateOutput(const OutputQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	if (info.m_InputTensorInfos.empty() )
	{
	throw InvalidArgumentException("RefWorkloadFactory::CreateOutput: Input cannot be zero length");
	}
	if (info.m_OutputTensorInfos.empty())
	{
	throw InvalidArgumentException("RefWorkloadFactory::CreateOutput: Output cannot be zero length");
	}
	if (info.m_InputTensorInfos[0].GetNumBytes() != info.m_OutputTensorInfos[0].GetNumBytes())
	{
	throw InvalidArgumentException("RefWorkloadFactory::CreateOutput: data input and output differ in byte count.");
	}

	return std::make_unique<CopyMemGenericWorkload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateActivation(const ActivationQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return std::make_unique<RefActivationWorkload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateArgMinMax(const ArgMinMaxQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return std::make_unique<RefArgMinMaxWorkload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateSoftmax(const SoftmaxQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return std::make_unique<RefSoftmaxWorkload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateSplitter(const SplitterQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return std::make_unique<RefSplitterWorkload>(descriptor, info);
	}

	std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateMerger(const MergerQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return CreateConcat(descriptor, info);
	}

	std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateFullyConnected(
	const FullyConnectedQueueDescriptor& descriptor, const WorkloadInfo& info) const
	{
	return std::make_unique<RefFullyConnectedWorkload>(descriptor, info);
	}

	std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreatePermute(const PermuteQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	if (IsQSymm16(info))
	{
	return std::make_unique<RefPermuteQSymm16Workload>(descriptor, info);
	}
	return MakeWorkloadHelper<RefPermuteFloat16Workload, RefPermuteFloat32Workload, RefPermuteQAsymm8Workload,
	NullWorkload, NullWorkload>(descriptor, info);
	}

	std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreatePooling2d(const Pooling2dQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return std::make_unique<RefPooling2dWorkload>(descriptor, info);
	}

	std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateConvolution2d(
	const Convolution2dQueueDescriptor& descriptor, const WorkloadInfo& info) const
	{
	return std::make_unique<RefConvolution2dWorkload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateDepthToSpace(const DepthToSpaceQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return std::make_unique<RefDepthToSpaceWorkload>(descriptor, info);
	}

	std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateDepthwiseConvolution2d(
	const DepthwiseConvolution2dQueueDescriptor& descriptor, const WorkloadInfo& info) const
	{
	return std::make_unique<RefDepthwiseConvolution2dWorkload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateDetectionPostProcess(
	const armnn::DetectionPostProcessQueueDescriptor& descriptor, const armnn::WorkloadInfo& info) const
	{
	return std::make_unique<RefDetectionPostProcessWorkload>(descriptor, info);
	}

	std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateNormalization(
	const NormalizationQueueDescriptor& descriptor, const WorkloadInfo& info) const
	{
	return std::make_unique<RefNormalizationWorkload>(descriptor, info);
	}

	std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateAddition(const AdditionQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return std::make_unique<RefAdditionWorkload>(descriptor, info);
	}

	std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateMultiplication(
	const MultiplicationQueueDescriptor& descriptor, const WorkloadInfo& info) const
	{
	return std::make_unique<RefMultiplicationWorkload>(descriptor, info);
	}

	std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateBatchNormalization(
	const BatchNormalizationQueueDescriptor& descriptor, const WorkloadInfo& info) const
	{
	return std::make_unique<RefBatchNormalizationWorkload>(descriptor, info);
	}

	std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateMemCopy(const MemCopyQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	if (descriptor.m_Inputs.empty())
	{
	throw InvalidArgumentException("RefWorkloadFactory: CreateMemCopy() expected an input tensor.");
	}
	return std::make_unique<CopyMemGenericWorkload>(descriptor, info);
	}

	std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateMemImport(const MemImportQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	if (descriptor.m_Inputs.empty())
	{
	throw InvalidArgumentException("RefWorkloadFactory: CreateMemImport() expected an input tensor.");
	}
	return std::make_unique<ImportMemGenericWorkload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateResize(const ResizeQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return std::make_unique<RefResizeWorkload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateResizeBilinear(const ResizeBilinearQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	ResizeQueueDescriptor resizeDescriptor;
	resizeDescriptor.m_Parameters.m_Method = ResizeMethod::Bilinear;
	resizeDescriptor.m_Parameters.m_DataLayout = descriptor.m_Parameters.m_DataLayout;
	resizeDescriptor.m_Parameters.m_TargetWidth = descriptor.m_Parameters.m_TargetWidth;
	resizeDescriptor.m_Parameters.m_TargetHeight = descriptor.m_Parameters.m_TargetHeight;

	return CreateResize(resizeDescriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateFakeQuantization(
	const FakeQuantizationQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return MakeWorkload<RefFakeQuantizationFloat32Workload, NullWorkload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateL2Normalization(const L2NormalizationQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return std::make_unique<RefL2NormalizationWorkload>(descriptor, info);
	}

	std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateConcat(const ConcatQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return std::make_unique<RefConcatWorkload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateConstant(const ConstantQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return std::make_unique<RefConstantWorkload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateReshape(const ReshapeQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return std::make_unique<RefReshapeWorkload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateSpaceToBatchNd(const SpaceToBatchNdQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return std::make_unique<RefSpaceToBatchNdWorkload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateSpaceToDepth(const armnn::SpaceToDepthQueueDescriptor& descriptor,
	const armnn::WorkloadInfo& info) const
	{
	return std::make_unique<RefSpaceToDepthWorkload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateFloor(const FloorQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return std::make_unique<RefFloorWorkload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateLstm(const LstmQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return std::make_unique<RefLstmWorkload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateConvertFp16ToFp32(
	const ConvertFp16ToFp32QueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return std::make_unique<RefConvertFp16ToFp32Workload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateConvertFp32ToFp16(
	const ConvertFp32ToFp16QueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return std::make_unique<RefConvertFp32ToFp16Workload>(descriptor, info);
	}

	std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateDivision(
	const DivisionQueueDescriptor& descriptor, const WorkloadInfo& info) const
	{
	return std::make_unique<RefDivisionWorkload>(descriptor, info);
	}

	std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateSubtraction(
	const SubtractionQueueDescriptor& descriptor, const WorkloadInfo& info) const
	{
	return std::make_unique<RefSubtractionWorkload>(descriptor, info);
	}

	std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateMaximum(
	const MaximumQueueDescriptor& descriptor, const WorkloadInfo& info) const
	{
	return std::make_unique<RefMaximumWorkload>(descriptor, info);
	}

	std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateMean(
	const MeanQueueDescriptor& descriptor, const WorkloadInfo& info) const
	{
	return std::make_unique<RefMeanWorkload>(descriptor, info);
	}

	std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateMinimum(
	const MinimumQueueDescriptor& descriptor, const WorkloadInfo& info) const
	{
	return std::make_unique<RefMinimumWorkload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreatePad(const PadQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	if (IsQSymm16(info))
	{
	return std::make_unique<RefPadQSymm16Workload>(descriptor, info);
	}
	else if (IsFloat16(info))
	{
	return std::make_unique<RefPadFloat16Workload>(descriptor, info);
	}
	return MakeWorkload<RefPadFloat32Workload, RefPadQAsymm8Workload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateEqual(const EqualQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return std::make_unique<RefEqualWorkload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateBatchToSpaceNd(const BatchToSpaceNdQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return std::make_unique<RefBatchToSpaceNdWorkload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateStridedSlice(const StridedSliceQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return std::make_unique<RefStridedSliceWorkload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateGreater(const GreaterQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return std::make_unique<RefGreaterWorkload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateDebug(const DebugQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	if (IsQSymm16(info))
	{
	return std::make_unique<RefDebugQSymm16Workload>(descriptor, info);
	}
	return MakeWorkload<RefDebugFloat32Workload, RefDebugQAsymm8Workload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateRsqrt(const RsqrtQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return std::make_unique<RefRsqrtWorkload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateGather(const armnn::GatherQueueDescriptor& descriptor,
	const armnn::WorkloadInfo& info) const
	{
	return std::make_unique<RefGatherWorkload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreatePreCompiled(const PreCompiledQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return nullptr;
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateQuantize(const QuantizeQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return std::make_unique<RefQuantizeWorkload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateDequantize(const DequantizeQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return std::make_unique<RefDequantizeWorkload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreatePrelu(const PreluQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return std::make_unique<RefPreluWorkload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateTransposeConvolution2d(
	const TransposeConvolution2dQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return std::make_unique<RefTransposeConvolution2dWorkload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateStack(const StackQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return std::make_unique<RefStackWorkload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateAbs(const AbsQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return std::make_unique<RefAbsWorkload>(descriptor, info);
	}

	std::unique_ptr<IWorkload> RefWorkloadFactory::CreateSlice(const SliceQueueDescriptor& descriptor,
	const WorkloadInfo& info) const
	{
	return std::make_unique<RefSliceWorkload>(descriptor, info);
	}

	std::unique_ptr<armnn::IWorkload> RefWorkloadFactory::CreateInstanceNormalization(
	const InstanceNormalizationQueueDescriptor& descriptor, const WorkloadInfo& info) const
	{
	return std::make_unique<RefInstanceNormalizationWorkload>(descriptor, info);
	}

	} // namespace armnn