tensorflow/lite/delegates/gpu/cl/tensor.cc - platform/external/tensorflow - Git at Google

 /* Copyright 2019 The TensorFlow Authors. All Rights Reserved.

 Licensed under the Apache License, Version 2.0 (the "License");
 you may not use this file except in compliance with the License.
 You may obtain a copy of the License at

     http://www.apache.org/licenses/LICENSE-2.0

 Unless required by applicable law or agreed to in writing, software
 distributed under the License is distributed on an "AS IS" BASIS,
 WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 See the License for the specific language governing permissions and
 limitations under the License.
 ==============================================================================*/

 #include "tensorflow/lite/delegates/gpu/cl/tensor.h"

 #include <cstdint>
 #include <cstring>
 #include <memory>
 #include <utility>
 #include <vector>

 #include "absl/strings/str_cat.h"
 #include "tensorflow/lite/delegates/gpu/cl/buffer.h"
 #include "tensorflow/lite/delegates/gpu/cl/cl_image_format.h"
 #include "tensorflow/lite/delegates/gpu/common/data_type.h"
 #include "tensorflow/lite/delegates/gpu/common/status.h"
 #include "tensorflow/lite/delegates/gpu/common/task/tensor_desc.h"
 #include "tensorflow/lite/delegates/gpu/common/task/texture2d_desc.h"

 namespace tflite {
 namespace gpu {
 namespace cl {
 namespace {
 absl::Status AllocateTensorMemory(const CLContext& context, const BHWDC& shape,
                                   const TensorDescriptor& descriptor,
                                   const void* data_ptr, CLMemory* result) {
   const int slices = DivideRoundUp(shape.c, 4);
   cl_mem_flags mem_flags = CL_MEM_READ_WRITE;
   if (data_ptr) {
     mem_flags |= CL_MEM_COPY_HOST_PTR;
   }
   switch (descriptor.GetStorageType()) {
     case TensorStorageType::BUFFER:
     case TensorStorageType::IMAGE_BUFFER: {
       const size_t data_size = shape.b * shape.w * shape.h * shape.d * slices *
                                4 * SizeOf(descriptor.GetDataType());
       cl_int error_code;
       cl_mem memory = clCreateBuffer(context.context(), mem_flags, data_size,
                                      const_cast<void*>(data_ptr), &error_code);
       if (!memory) {
         return absl::UnknownError(
             absl::StrCat("Failed to allocate device memory (clCreateBuffer): ",
                          CLErrorCodeToString(error_code)));
       }
       *result = CLMemory(memory, true);
       return absl::OkStatus();
     }
     case TensorStorageType::TEXTURE_2D: {
       cl_image_desc desc;
       desc.image_type = CL_MEM_OBJECT_IMAGE2D;
       desc.image_width = shape.w * shape.b * shape.d;
       desc.image_height = shape.h * slices;
       desc.image_depth = 0;
       desc.image_row_pitch = 0;
       desc.image_slice_pitch = 0;
       desc.num_mip_levels = 0;
       desc.num_samples = 0;
       desc.buffer = nullptr;

       cl_image_format format;
       format.image_channel_order = CL_RGBA;
       format.image_channel_data_type =
           DataTypeToChannelType(descriptor.GetDataType());

       cl_int error_code;
       cl_mem memory =
           CreateImage2DLegacy(context.context(), mem_flags, &format, &desc,
                               const_cast<void*>(data_ptr), &error_code);
       if (error_code != CL_SUCCESS) {
         return absl::UnknownError(
             absl::StrCat("Failed to create 2D texture (clCreateImage): ",
                          CLErrorCodeToString(error_code)));
       }

       *result = CLMemory(memory, true);
       return absl::OkStatus();
     }
     case TensorStorageType::TEXTURE_3D: {
       cl_image_desc desc;
       desc.image_type = CL_MEM_OBJECT_IMAGE3D;
       desc.image_width = shape.w * shape.b;
       desc.image_height = shape.h;
       desc.image_depth = slices * shape.d;
       desc.image_row_pitch = 0;
       desc.image_slice_pitch = 0;
       desc.num_mip_levels = 0;
       desc.num_samples = 0;
       desc.buffer = nullptr;

       cl_image_format format;
       format.image_channel_order = CL_RGBA;
       format.image_channel_data_type =
           DataTypeToChannelType(descriptor.GetDataType());

       cl_int error_code;
       cl_mem memory =
           CreateImage3DLegacy(context.context(), mem_flags, &format, &desc,
                               const_cast<void*>(data_ptr), &error_code);
       if (error_code != CL_SUCCESS) {
         return absl::UnknownError(
             absl::StrCat("Failed to create 3D texture (clCreateImage): ",
                          CLErrorCodeToString(error_code)));
       }

       *result = CLMemory(memory, true);
       return absl::OkStatus();
     }
     case TensorStorageType::TEXTURE_ARRAY: {
       cl_image_desc desc;
       desc.image_type = CL_MEM_OBJECT_IMAGE2D_ARRAY;
       desc.image_width = shape.w * shape.b;
       desc.image_height = shape.h;
       desc.image_depth = 0;
       desc.image_array_size = slices * shape.d;
       desc.image_row_pitch = 0;
       desc.image_slice_pitch = 0;
       desc.num_mip_levels = 0;
       desc.num_samples = 0;
       desc.buffer = nullptr;

       cl_image_format format;
       format.image_channel_order = CL_RGBA;
       format.image_channel_data_type =
           DataTypeToChannelType(descriptor.GetDataType());

       cl_int error_code;
       cl_mem memory =
           clCreateImage(context.context(), mem_flags, &format, &desc,
                         const_cast<void*>(data_ptr), &error_code);
       if (error_code != CL_SUCCESS) {
         return absl::UnknownError(
             absl::StrCat("Failed to create 2D texture array (clCreateImage): ",
                          CLErrorCodeToString(error_code)));
       }

       *result = CLMemory(memory, true);
       return absl::OkStatus();
     }

     case TensorStorageType::SINGLE_TEXTURE_2D: {
       if (slices != 1) {
         return absl::InvalidArgumentError(absl::StrCat(
             "SINGLE_TEXTURE_2D support only channels in range [1-4], but ",
             shape.c, "was provided"));
       }
       cl_image_desc desc;
       desc.image_type = CL_MEM_OBJECT_IMAGE2D;
       desc.image_width = shape.w * shape.b * shape.d;
       desc.image_height = shape.h;
       desc.image_depth = 0;
       desc.image_row_pitch = 0;
       desc.image_slice_pitch = 0;
       desc.num_mip_levels = 0;
       desc.num_samples = 0;
       desc.buffer = nullptr;

       cl_image_format format;
       if (context.IsFloatTexture2DSupported(shape.c,
                                             descriptor.GetDataType())) {
         format.image_channel_order = ToChannelOrder(shape.c);
         format.image_channel_data_type =
             DataTypeToChannelType(descriptor.GetDataType());
       } else {
         return absl::InvalidArgumentError(absl::StrCat(
             "This device doesn't support ", shape.c, "-channel textures."));
       }

       cl_int error_code;
       cl_mem memory =
           CreateImage2DLegacy(context.context(), mem_flags, &format, &desc,
                               const_cast<void*>(data_ptr), &error_code);
       if (error_code != CL_SUCCESS) {
         return absl::UnknownError(
             absl::StrCat("Failed to create single 2D texture (clCreateImage): ",
                          CLErrorCodeToString(error_code)));
       }

       *result = CLMemory(memory, true);
       return absl::OkStatus();
     }

     default:
       return absl::InternalError("Unsupported tensor storage type");
   }
 }

 absl::Status CreateImageBufferFromBuffer(const CLContext& context,
                                          cl_mem memory, DataType data_type,
                                          int width, cl_mem* result) {
   cl_image_format format;
   cl_image_desc desc;
   std::memset(&desc, 0, sizeof(desc));
   desc.image_type = CL_MEM_OBJECT_IMAGE1D_BUFFER;
   desc.image_width = width;
   desc.mem_object = memory;

   format.image_channel_data_type = DataTypeToChannelType(data_type);
   format.image_channel_order = CL_RGBA;

   cl_int error_code;
   *result = clCreateImage(context.context(), CL_MEM_READ_WRITE, &format, &desc,
                           nullptr, &error_code);
   if (error_code != CL_SUCCESS) {
     return absl::UnknownError(
         absl::StrCat("Failed to create Image from Buffer (clCreateImage): ",
                      CLErrorCodeToString(error_code)));
   }
   return absl::OkStatus();
 }

 absl::Status CreateImage2DFromBuffer(const CLContext& context, cl_mem memory,
                                      DataType data_type, int width, int height,
                                      int channels, int width_pixel_alignment,
                                      cl_mem* result) {
   if (!context.IsFloatTexture2DSupported(channels, data_type)) {
     return absl::InvalidArgumentError(absl::StrCat(
         "This device doesn't support ", channels, "-channel textures."));
   }

   cl_image_desc desc;
   desc.image_type = CL_MEM_OBJECT_IMAGE2D;
   desc.image_width = width;
   desc.image_height = height;
   desc.image_depth = 0;
   const size_t width_aligned = AlignByN(width, width_pixel_alignment);
   desc.image_row_pitch = width_aligned * channels * SizeOf(data_type);
   desc.image_slice_pitch = 0;
   desc.num_mip_levels = 0;
   desc.num_samples = 0;
   desc.mem_object = memory;

   cl_image_format format;
   format.image_channel_order = ToChannelOrder(channels);
   format.image_channel_data_type = DataTypeToChannelType(data_type);

   cl_int error_code;
   *result = CreateImage2DLegacy(context.context(), CL_MEM_READ_WRITE, &format,
                                 &desc, nullptr, &error_code);
   if (error_code != CL_SUCCESS) {
     return absl::UnknownError(
         absl::StrCat("Failed to create Image2D from Buffer (clCreateImage): ",
                      CLErrorCodeToString(error_code)));
   }
   return absl::OkStatus();
 }

 absl::Status CreateTensorShared(const CLContext& context, const BHWDC& shape,
                                 const TensorDescriptor& descriptor,
                                 cl_mem memory, Tensor* result) {
   const bool memory_owner = false;
   if (descriptor.GetStorageType() == TensorStorageType::IMAGE_BUFFER) {
     cl_mem image_memory;
     RETURN_IF_ERROR(CreateImageBufferFromBuffer(
         context, memory, descriptor.GetDataType(),
         shape.b * shape.w * shape.h * shape.d * DivideRoundUp(shape.c, 4),
         &image_memory));
     *result = Tensor(memory, memory_owner, image_memory, shape, descriptor);
   } else {
     *result = Tensor(memory, memory_owner, shape, descriptor);
   }
   return absl::OkStatus();
 }

 }  // namespace

 Tensor::Tensor(cl_mem memory, bool memory_owner, const BHWC& shape,
                const TensorDescriptor& descriptor)
     : memory_(memory),
       image_buffer_memory_(nullptr),
       memory_owner_(memory_owner),
       shape_(shape.b, shape.h, shape.w, 1, shape.c),
       descriptor_(descriptor) {}

 Tensor::Tensor(cl_mem memory, bool memory_owner, const BHWDC& shape,
                const TensorDescriptor& descriptor)
     : memory_(memory),
       image_buffer_memory_(nullptr),
       memory_owner_(memory_owner),
       shape_(shape),
       descriptor_(descriptor) {}

 Tensor::Tensor(cl_mem memory, bool memory_owner, cl_mem image_buffer_memory,
                const BHWC& shape, const TensorDescriptor& descriptor)
     : memory_(memory),
       image_buffer_memory_(image_buffer_memory),
       memory_owner_(memory_owner),
       shape_(shape.b, shape.h, shape.w, 1, shape.c),
       descriptor_(descriptor) {
   if (image_buffer_memory &&
       (descriptor.GetStorageType() == TensorStorageType::TEXTURE_2D ||
        descriptor.GetStorageType() == TensorStorageType::SINGLE_TEXTURE_2D)) {
     buffer_based_ = true;
   }
 }

 Tensor::Tensor(cl_mem memory, bool memory_owner, cl_mem image_buffer_memory,
                const BHWDC& shape, const TensorDescriptor& descriptor)
     : memory_(memory),
       image_buffer_memory_(image_buffer_memory),
       memory_owner_(memory_owner),
       shape_(shape),
       descriptor_(descriptor) {
   if (image_buffer_memory &&
       (descriptor.GetStorageType() == TensorStorageType::TEXTURE_2D ||
        descriptor.GetStorageType() == TensorStorageType::SINGLE_TEXTURE_2D)) {
     buffer_based_ = true;
   }
 }

 Tensor::Tensor(Tensor&& tensor)
     : memory_(tensor.memory_),
       image_buffer_memory_(tensor.image_buffer_memory_),
       memory_owner_(tensor.memory_owner_),
       buffer_based_(tensor.buffer_based_),
       shape_(tensor.shape_),
       descriptor_(tensor.descriptor_),
       aligned_texture_width_(tensor.aligned_texture_width_) {
   tensor.memory_ = nullptr;
   tensor.image_buffer_memory_ = nullptr;
 }

 Tensor& Tensor::operator=(Tensor&& tensor) {
   if (this != &tensor) {
     Release();
     std::swap(memory_, tensor.memory_);
     std::swap(image_buffer_memory_, tensor.image_buffer_memory_);
     std::swap(memory_owner_, tensor.memory_owner_);
     std::swap(buffer_based_, tensor.buffer_based_);
     std::swap(shape_, tensor.shape_);
     std::swap(descriptor_, tensor.descriptor_);
     std::swap(aligned_texture_width_, tensor.aligned_texture_width_);
   }
   return *this;
 }

 void Tensor::Release() {
   // image_buffer_memory_ always owned by object
   if (image_buffer_memory_) {
     clReleaseMemObject(image_buffer_memory_);
     image_buffer_memory_ = nullptr;
   }
   if (memory_owner_ && memory_) {
     clReleaseMemObject(memory_);
     memory_ = nullptr;
   }
 }

 absl::Status Tensor::GetGPUResources(const GPUObjectDescriptor* obj_ptr,
                                      GPUResourcesWithValue* resources) const {
   const auto* buffer_desc = dynamic_cast<const BufferDescriptor*>(obj_ptr);
   if (buffer_desc) {
     if (descriptor_.GetStorageType() != TensorStorageType::BUFFER &&
         descriptor_.GetStorageType() != TensorStorageType::IMAGE_BUFFER) {
       return absl::InvalidArgumentError(
           "Tensor can be used with BufferDescriptor only with "
           "TensorStorageType::BUFFER/TensorStorageType::IMAGE_BUFFER.");
     }
     resources->buffers.push_back({"buffer", memory_});
     return absl::OkStatus();
   }
   const auto* texture2d_desc =
       dynamic_cast<const Texture2DDescriptor*>(obj_ptr);
   if (texture2d_desc) {
     if (descriptor_.GetStorageType() != TensorStorageType::TEXTURE_2D) {
       return absl::InvalidArgumentError(
           "Tensor can be used with Texture2DDescriptor only with "
           "TensorStorageType::TEXTURE_2D.");
     }
     cl_mem mem = buffer_based_ ? image_buffer_memory_ : memory_;
     resources->images2d.push_back({"tex2d", mem});
     return absl::OkStatus();
   }
   const auto* tensor_desc = dynamic_cast<const TensorDescriptor*>(obj_ptr);
   if (!tensor_desc) {
     return absl::InvalidArgumentError("Expected TensorDescriptor on input.");
   }
   tensor_desc->GetGpuResources(shape_, &resources->generic);

   if (descriptor_.GetStorageType() == TensorStorageType::BUFFER) {
     resources->buffers.push_back({"buffer", memory_});
   } else if (descriptor_.GetStorageType() == TensorStorageType::TEXTURE_2D ||
              descriptor_.GetStorageType() ==
                  TensorStorageType::SINGLE_TEXTURE_2D) {
     if (obj_ptr->GetAccess() == AccessType::WRITE &&
         tensor_desc->GetUseBufferForWriteOnlyTexture2d()) {
       resources->AddInt("aligned_texture_width", aligned_texture_width_);
       resources->buffers.push_back({"buffer", memory_});
     } else {
       cl_mem mem = buffer_based_ ? image_buffer_memory_ : memory_;
       resources->images2d.push_back({"image2d", mem});
     }
   } else if (descriptor_.GetStorageType() == TensorStorageType::TEXTURE_ARRAY) {
     resources->image2d_arrays.push_back({"image2d_array", memory_});
   } else if (descriptor_.GetStorageType() == TensorStorageType::TEXTURE_3D) {
     resources->images3d.push_back({"image3d", memory_});
   } else if (descriptor_.GetStorageType() == TensorStorageType::IMAGE_BUFFER) {
     if (obj_ptr->GetAccess() == AccessType::WRITE &&
         tensor_desc->GetUseBufferForWriteOnlyImageBuffer()) {
       resources->buffers.push_back({"buffer", memory_});
     } else {
       resources->image_buffers.push_back(
           {"image_buffer", image_buffer_memory_});
     }
   }

   return absl::OkStatus();
 }

 int3 Tensor::GetFullTensorRegion() const {
   switch (descriptor_.GetStorageType()) {
     case TensorStorageType::BUFFER:
     case TensorStorageType::TEXTURE_ARRAY:
     case TensorStorageType::TEXTURE_3D:
     case TensorStorageType::IMAGE_BUFFER:
       return {shape_.w * shape_.b, shape_.h, shape_.d * Slices()};
     case TensorStorageType::TEXTURE_2D:
       return {shape_.w * shape_.b * shape_.d, shape_.h * Slices(), 1};
     case TensorStorageType::SINGLE_TEXTURE_2D:
       return {shape_.w * shape_.b * shape_.d, shape_.h, 1};
     case TensorStorageType::UNKNOWN:
       return {-1, -1, -1};
   }
 }

 absl::Status Tensor::IsValid(const BHWC& shape) const {
   if (shape.b != shape_.b) {
     return absl::InvalidArgumentError(
         "Shape batch does not match tensor batch");
   }
   if (shape.w != shape_.w) {
     return absl::InvalidArgumentError(
         "Shape width does not match tensor width");
   }
   if (shape.h != shape_.h) {
     return absl::InvalidArgumentError(
         "Shape height does not match tensor height");
   }
   if (shape.c != shape_.c) {
     return absl::InvalidArgumentError(
         "Shape channels does not match tensor channels");
   }
   return absl::OkStatus();
 }

 absl::Status Tensor::IsValid(const BHWDC& shape) const {
   if (shape.b != shape_.b) {
     return absl::InvalidArgumentError(
         "Shape batch does not match tensor batch");
   }
   if (shape.w != shape_.w) {
     return absl::InvalidArgumentError(
         "Shape width does not match tensor width");
   }
   if (shape.h != shape_.h) {
     return absl::InvalidArgumentError(
         "Shape height does not match tensor height");
   }
   if (shape.d != shape_.d) {
     return absl::InvalidArgumentError(
         "Shape depth does not match tensor depth");
   }
   if (shape.c != shape_.c) {
     return absl::InvalidArgumentError(
         "Shape channels does not match tensor channels");
   }
   return absl::OkStatus();
 }

 int Tensor::GetAlignedChannels() const {
   return descriptor_.GetStorageType() == TensorStorageType::SINGLE_TEXTURE_2D
              ? shape_.c
              : AlignByN(shape_.c, 4);
 }

 uint64_t Tensor::GetMemorySizeInBytes() const {
   const int flt_size = SizeOf(descriptor_.GetDataType());
   const int flt4_size = 4 * flt_size;
   switch (descriptor_.GetStorageType()) {
     case TensorStorageType::BUFFER:
     case TensorStorageType::IMAGE_BUFFER:
     case TensorStorageType::TEXTURE_ARRAY:
     case TensorStorageType::TEXTURE_2D:
     case TensorStorageType::TEXTURE_3D:
       return flt4_size * shape_.b * shape_.w * shape_.h * shape_.d * Slices();
     case TensorStorageType::SINGLE_TEXTURE_2D:
       return flt_size * shape_.w * shape_.h * shape_.c * shape_.b * shape_.d;
     default:
       return 0;
   }
 }

 cl_mem Tensor::GetMemoryPtr() const {
   if (buffer_based_) {
     return image_buffer_memory_;
   } else {
     return descriptor_.GetStorageType() == TensorStorageType::IMAGE_BUFFER
                ? image_buffer_memory_
                : memory_;
   }
 }

 cl_mem Tensor::GetMemoryPtrForWriting() const {
   if (buffer_based_) {
     return image_buffer_memory_;
   } else {
     return memory_;
   }
 }

 absl::Status Tensor::WriteData(
     CLCommandQueue* queue,
     const tflite::gpu::Tensor<Linear, DataType::FLOAT32>& src) {
   return WriteDataBHWDC(src.data.data(), queue);
 }

 absl::Status Tensor::WriteData(
     CLCommandQueue* queue,
     const tflite::gpu::Tensor<HWC, DataType::FLOAT32>& src) {
   return WriteDataBHWDC(src.data.data(), queue);
 }

 absl::Status Tensor::CreateFromDescriptor(const TensorDescriptor& desc,
                                           CLContext* context) {
   shape_ = desc.GetBHWDCShape();
   desc.CopyWithoutData(&descriptor_);
   memory_owner_ = true;
   CLMemory memory;
   const uint8_t* data_ptr =
       desc.GetData().empty() ? nullptr : desc.GetData().data();
   RETURN_IF_ERROR(
       AllocateTensorMemory(*context, shape_, descriptor_, data_ptr, &memory));
   memory_ = memory.Release();
   if (desc.GetStorageType() == TensorStorageType::IMAGE_BUFFER) {
     RETURN_IF_ERROR(CreateImageBufferFromBuffer(
         *context, memory_, desc.GetDataType(),
         shape_.b * shape_.w * shape_.h * shape_.d * DivideRoundUp(shape_.c, 4),
         &image_buffer_memory_));
   }
   return absl::OkStatus();
 }

 absl::Status Tensor::ToDescriptor(TensorDescriptor* desc,
                                   CLCommandQueue* queue) const {
   *desc = descriptor_;
   desc->SetBHWDCShape(shape_);
   std::vector<uint8_t> data(GetMemorySizeInBytes());
   RETURN_IF_ERROR(ReadData(data.data(), queue));
   desc->SetData(std::move(data));
   return absl::OkStatus();
 }

 absl::Status Tensor::WriteData(const void* ptr, CLCommandQueue* queue) {
   switch (descriptor_.GetStorageType()) {
     case TensorStorageType::BUFFER:
     case TensorStorageType::IMAGE_BUFFER:
       RETURN_IF_ERROR(
           queue->EnqueueWriteBuffer(memory_, GetMemorySizeInBytes(), ptr));
       break;
     case TensorStorageType::TEXTURE_ARRAY:
     case TensorStorageType::TEXTURE_2D:
     case TensorStorageType::TEXTURE_3D:
     case TensorStorageType::SINGLE_TEXTURE_2D: {
       cl_mem mem = buffer_based_ ? image_buffer_memory_ : memory_;
       RETURN_IF_ERROR(
           queue->EnqueueWriteImage(mem, GetFullTensorRegion(), ptr));
       break;
     }
     default:
       return absl::InternalError("Unsupported tensor storage type");
   }
   return absl::OkStatus();
 }

 absl::Status Tensor::ReadData(void* ptr, CLCommandQueue* queue) const {
   switch (descriptor_.GetStorageType()) {
     case TensorStorageType::BUFFER:
     case TensorStorageType::IMAGE_BUFFER:
       RETURN_IF_ERROR(
           queue->EnqueueReadBuffer(memory_, GetMemorySizeInBytes(), ptr));
       break;
     case TensorStorageType::TEXTURE_ARRAY:
     case TensorStorageType::TEXTURE_2D:
     case TensorStorageType::TEXTURE_3D:
     case TensorStorageType::SINGLE_TEXTURE_2D: {
       cl_mem mem = buffer_based_ ? image_buffer_memory_ : memory_;
       RETURN_IF_ERROR(queue->EnqueueReadImage(mem, GetFullTensorRegion(), ptr));
       break;
     }
     default:
       return absl::InternalError("Unsupported tensor storage type");
   }
   return absl::OkStatus();
 }

 absl::Status CreateTensor(const CLContext& context,
                           const TensorDescriptor& descriptor, Tensor* result) {
   const BHWDC& shape = descriptor.GetBHWDCShape();
   CLMemory mem;
   RETURN_IF_ERROR(
       AllocateTensorMemory(context, shape, descriptor, nullptr, &mem));
   cl_mem memory = mem.Release();
   if (descriptor.GetStorageType() == TensorStorageType::IMAGE_BUFFER) {
     cl_mem image_memory;
     RETURN_IF_ERROR(CreateImageBufferFromBuffer(
         context, memory, descriptor.GetDataType(),
         shape.b * shape.w * shape.h * shape.d * DivideRoundUp(shape.c, 4),
         &image_memory));
     *result =
         Tensor(memory, /*memory_owner*/ true, image_memory, shape, descriptor);
   } else {
     *result = Tensor(memory, /*memory_owner*/ true, shape, descriptor);
   }
   return absl::OkStatus();
 }

 absl::Status CreateSharedTensor(const CLContext& context, cl_mem memory,
                                 const BHWC& shape,
                                 const TensorDescriptor& descriptor,
                                 Tensor* result) {
   const BHWDC shape5D(shape.b, shape.h, shape.w, 1, shape.c);
   return CreateTensorShared(context, shape5D, descriptor, memory, result);
 }

 absl::Status CreateSharedTensor(const CLContext& context, cl_mem memory,
                                 const BHWDC& shape,
                                 const TensorDescriptor& descriptor,
                                 Tensor* result) {
   return CreateTensorShared(context, shape, descriptor, memory, result);
 }

 absl::Status CreateTensorSharedImage2DBuffer(const CLContext& context,
                                              cl_mem memory,
                                              const TensorDescriptor& descriptor,
                                              int width_pixel_alignment,
                                              Tensor* result) {
   const BHWDC& shape = descriptor.GetBHWDCShape();
   const int width = shape.b * shape.w * shape.d;
   const int height =
       descriptor.GetStorageType() == TensorStorageType::SINGLE_TEXTURE_2D
           ? shape.h
           : shape.h * DivideRoundUp(shape.c, 4);
   const int channels =
       descriptor.GetStorageType() == TensorStorageType::SINGLE_TEXTURE_2D
           ? shape.c
           : 4;
   cl_mem image_memory;
   RETURN_IF_ERROR(CreateImage2DFromBuffer(
       context, memory, descriptor.GetDataType(), width, height, channels,
       width_pixel_alignment, &image_memory));
   *result = Tensor(memory, false, image_memory, shape, descriptor);
   result->aligned_texture_width_ = AlignByN(width, width_pixel_alignment);
   return absl::OkStatus();
 }

 absl::Status AllocateTensorMemory(const CLContext& context,
                                   const TensorDescriptor& descriptor,
                                   CLMemory* result) {
   return AllocateTensorMemory(context, descriptor.GetBHWDCShape(), descriptor,
                               nullptr, result);
 }

 }  // namespace cl
 }  // namespace gpu
 }  // namespace tflite