aten/src/ATen/native/mkl/LinearAlgebra.cpp - platform/external/pytorch - Git at Google

 #include <ATen/native/mkl/LinearAlgebra.h>
 #include <ATen/Config.h>

 #if !AT_MKL_ENABLED()

 namespace at { namespace native {

 void mkl_gemm_batched(
     const TransposeType trans_A, const TransposeType trans_B,
     const int batch_size, const int M, const int N, const int K, const float alpha,
     const float** A, const int lda, const float** B, const int ldb, const float beta,
     float** C, const int ldc) {
   TORCH_INTERNAL_ASSERT(false, "mkl_gemm_batched: ATen not compiled with MKL support");
 }

 void mkl_gemm_batched(
     const TransposeType trans_A, const TransposeType trans_B,
     const int batch_size, const int M, const int N, const int K, const double alpha,
     const double** A, const int lda, const double** B, const int ldb, const double beta,
     double** C, const int ldc) {
   TORCH_INTERNAL_ASSERT(false, "mkl_gemm_batched: ATen not compiled with MKL support");
 }

 void mkl_gemm_batched(
     const TransposeType trans_A, const TransposeType trans_B,
     const int batch_size, const int M, const int N, const int K, const c10::complex<float> alpha,
     const c10::complex<float>** A, const int lda, const c10::complex<float>** B, const int ldb,
     const c10::complex<float> beta, c10::complex<float>** C, const int ldc) {
   TORCH_INTERNAL_ASSERT(false, "mkl_gemm_batched: ATen not compiled with MKL support");
 }

 void mkl_gemm_batched(
     const TransposeType trans_A, const TransposeType trans_B,
     const int batch_size, const int M, const int N, const int K, const c10::complex<double> alpha,
     const c10::complex<double>** A, const int lda, const c10::complex<double>** B, const int ldb,
     const c10::complex<double> beta, c10::complex<double>** C, const int ldc) {
   TORCH_INTERNAL_ASSERT(false, "mkl_gemm_batched: ATen not compiled with MKL support");
 }

 }}

 #else // AT_MKL_ENABLED

 #include <mkl.h>

 namespace at { namespace native {

 static CBLAS_TRANSPOSE to_cblas(TransposeType x) {
   switch (x) {
     case TransposeType::NoTranspose: return CblasNoTrans;
     case TransposeType::Transpose: return CblasTrans;
     case TransposeType::ConjTranspose: return CblasConjTrans;
   }
   TORCH_INTERNAL_ASSERT(false, "Unknown TransposeType");
 }

 void mkl_gemm_batched(
     const TransposeType trans_A, const TransposeType trans_B,
     const int batch_size, const int M, const int N, const int K, const float alpha,
     const float** A, const int lda, const float** B, const int ldb, const float beta,
     float** C, const int ldc) {
   auto transa_cblas = to_cblas(trans_A);
   auto transb_cblas = to_cblas(trans_B);
   cblas_sgemm_batch(CblasColMajor, &transa_cblas, &transb_cblas, &M, &N, &K, &alpha,
                     A, &lda, B, &ldb, &beta, C, &ldc, 1, &batch_size);
 }

 void mkl_gemm_batched(
     const TransposeType trans_A, const TransposeType trans_B,
     const int batch_size, const int M, const int N, const int K, const double alpha,
     const double** A, const int lda, const double** B, const int ldb, const double beta,
     double** C, const int ldc) {
   auto transa_cblas = to_cblas(trans_A);
   auto transb_cblas = to_cblas(trans_B);
   cblas_dgemm_batch(CblasColMajor, &transa_cblas, &transb_cblas, &M, &N, &K, &alpha,
                     A, &lda, B, &ldb, &beta, C, &ldc, 1, &batch_size);
 }

 void mkl_gemm_batched(
     const TransposeType trans_A, const TransposeType trans_B,
     const int batch_size, const int M, const int N, const int K, const c10::complex<float> alpha,
     const c10::complex<float>** A, const int lda, const c10::complex<float>** B, const int ldb,
     const c10::complex<float> beta, c10::complex<float>** C, const int ldc) {
   auto transa_cblas = to_cblas(trans_A);
   auto transb_cblas = to_cblas(trans_B);
   cblas_cgemm_batch(CblasColMajor, &transa_cblas, &transb_cblas, &M, &N, &K,
                     reinterpret_cast<const void*>(&alpha),
                     reinterpret_cast<const void**>(A), &lda, reinterpret_cast<const void**>(B), &ldb,
                     reinterpret_cast<const void*>(&beta), reinterpret_cast<void**>(C), &ldc, 1, &batch_size);
 }

 void mkl_gemm_batched(
     const TransposeType trans_A, const TransposeType trans_B,
     const int batch_size, const int M, const int N, const int K, const c10::complex<double> alpha,
     const c10::complex<double>** A, const int lda, const c10::complex<double>** B, const int ldb,
     const c10::complex<double> beta, c10::complex<double>** C, const int ldc) {
   auto transa_cblas = to_cblas(trans_A);
   auto transb_cblas = to_cblas(trans_B);
   cblas_zgemm_batch(CblasColMajor, &transa_cblas, &transb_cblas, &M, &N, &K,
                     reinterpret_cast<const void*>(&alpha),
                     reinterpret_cast<const void**>(A), &lda, reinterpret_cast<const void**>(B), &ldb,
                     reinterpret_cast<const void*>(&beta), reinterpret_cast<void**>(C), &ldc, 1, &batch_size);
 }

 }} // namespace at::native

 #endif
	#include <ATen/native/mkl/LinearAlgebra.h>
	#include <ATen/Config.h>

	#if !AT_MKL_ENABLED()

	namespace at { namespace native {

	void mkl_gemm_batched(
	const TransposeType trans_A, const TransposeType trans_B,
	const int batch_size, const int M, const int N, const int K, const float alpha,
	const float A, const int lda, const float B, const int ldb, const float beta,
	float** C, const int ldc) {
	TORCH_INTERNAL_ASSERT(false, "mkl_gemm_batched: ATen not compiled with MKL support");
	}

	void mkl_gemm_batched(
	const TransposeType trans_A, const TransposeType trans_B,
	const int batch_size, const int M, const int N, const int K, const double alpha,
	const double A, const int lda, const double B, const int ldb, const double beta,
	double** C, const int ldc) {
	TORCH_INTERNAL_ASSERT(false, "mkl_gemm_batched: ATen not compiled with MKL support");
	}

	void mkl_gemm_batched(
	const TransposeType trans_A, const TransposeType trans_B,
	const int batch_size, const int M, const int N, const int K, const c10::complex<float> alpha,
	const c10::complex<float> A, const int lda, const c10::complex<float> B, const int ldb,
	const c10::complex<float> beta, c10::complex<float>** C, const int ldc) {
	TORCH_INTERNAL_ASSERT(false, "mkl_gemm_batched: ATen not compiled with MKL support");
	}

	void mkl_gemm_batched(
	const TransposeType trans_A, const TransposeType trans_B,
	const int batch_size, const int M, const int N, const int K, const c10::complex<double> alpha,
	const c10::complex<double> A, const int lda, const c10::complex<double> B, const int ldb,
	const c10::complex<double> beta, c10::complex<double>** C, const int ldc) {
	TORCH_INTERNAL_ASSERT(false, "mkl_gemm_batched: ATen not compiled with MKL support");
	}

	}}

	#else // AT_MKL_ENABLED

	#include <mkl.h>

	namespace at { namespace native {

	static CBLAS_TRANSPOSE to_cblas(TransposeType x) {
	switch (x) {
	case TransposeType::NoTranspose: return CblasNoTrans;
	case TransposeType::Transpose: return CblasTrans;
	case TransposeType::ConjTranspose: return CblasConjTrans;
	}
	TORCH_INTERNAL_ASSERT(false, "Unknown TransposeType");
	}

	void mkl_gemm_batched(
	const TransposeType trans_A, const TransposeType trans_B,
	const int batch_size, const int M, const int N, const int K, const float alpha,
	const float A, const int lda, const float B, const int ldb, const float beta,
	float** C, const int ldc) {
	auto transa_cblas = to_cblas(trans_A);
	auto transb_cblas = to_cblas(trans_B);
	cblas_sgemm_batch(CblasColMajor, &transa_cblas, &transb_cblas, &M, &N, &K, &alpha,
	A, &lda, B, &ldb, &beta, C, &ldc, 1, &batch_size);
	}

	void mkl_gemm_batched(
	const TransposeType trans_A, const TransposeType trans_B,
	const int batch_size, const int M, const int N, const int K, const double alpha,
	const double A, const int lda, const double B, const int ldb, const double beta,
	double** C, const int ldc) {
	auto transa_cblas = to_cblas(trans_A);
	auto transb_cblas = to_cblas(trans_B);
	cblas_dgemm_batch(CblasColMajor, &transa_cblas, &transb_cblas, &M, &N, &K, &alpha,
	A, &lda, B, &ldb, &beta, C, &ldc, 1, &batch_size);
	}

	void mkl_gemm_batched(
	const TransposeType trans_A, const TransposeType trans_B,
	const int batch_size, const int M, const int N, const int K, const c10::complex<float> alpha,
	const c10::complex<float> A, const int lda, const c10::complex<float> B, const int ldb,
	const c10::complex<float> beta, c10::complex<float>** C, const int ldc) {
	auto transa_cblas = to_cblas(trans_A);
	auto transb_cblas = to_cblas(trans_B);
	cblas_cgemm_batch(CblasColMajor, &transa_cblas, &transb_cblas, &M, &N, &K,
	reinterpret_cast<const void*>(&alpha),
	reinterpret_cast<const void>(A), &lda, reinterpret_cast<const void>(B), &ldb,
	reinterpret_cast<const void>(&beta), reinterpret_cast<void*>(C), &ldc, 1, &batch_size);
	}

	void mkl_gemm_batched(
	const TransposeType trans_A, const TransposeType trans_B,
	const int batch_size, const int M, const int N, const int K, const c10::complex<double> alpha,
	const c10::complex<double> A, const int lda, const c10::complex<double> B, const int ldb,
	const c10::complex<double> beta, c10::complex<double>** C, const int ldc) {
	auto transa_cblas = to_cblas(trans_A);
	auto transb_cblas = to_cblas(trans_B);
	cblas_zgemm_batch(CblasColMajor, &transa_cblas, &transb_cblas, &M, &N, &K,
	reinterpret_cast<const void*>(&alpha),
	reinterpret_cast<const void>(A), &lda, reinterpret_cast<const void>(B), &ldb,
	reinterpret_cast<const void>(&beta), reinterpret_cast<void*>(C), &ldc, 1, &batch_size);
	}

	}} // namespace at::native

	#endif