vp9/common/vp9_invtrans.c - platform/external/libvpx - Git at Google

 /*
  *  Copyright (c) 2010 The WebM project authors. All Rights Reserved.
  *
  *  Use of this source code is governed by a BSD-style license
  *  that can be found in the LICENSE file in the root of the source
  *  tree. An additional intellectual property rights grant can be found
  *  in the file PATENTS.  All contributing project authors may
  *  be found in the AUTHORS file in the root of the source tree.
  */

 #include "vp9/common/vp9_invtrans.h"
 #include "./vp9_rtcd.h"

 void vp9_inverse_transform_b_4x4(MACROBLOCKD *xd, int eob,
                                  int16_t *dqcoeff, int16_t *diff,
                                  int pitch) {
   if (eob <= 1)
     xd->inv_txm4x4_1(dqcoeff, diff, pitch);
   else
     xd->inv_txm4x4(dqcoeff, diff, pitch);
 }

 void vp9_inverse_transform_mby_4x4(MACROBLOCKD *xd) {
   int i;

   for (i = 0; i < 16; i++) {
     TX_TYPE tx_type = get_tx_type_4x4(xd, i);
     if (tx_type != DCT_DCT) {
       vp9_short_iht4x4(xd->block[i].dqcoeff, xd->block[i].diff, 16, tx_type);
     } else {
       vp9_inverse_transform_b_4x4(xd, xd->eobs[i], xd->block[i].dqcoeff,
                                   xd->block[i].diff, 32);
     }
   }
 }

 void vp9_inverse_transform_mbuv_4x4(MACROBLOCKD *xd) {
   int i;

   for (i = 16; i < 24; i++) {
     vp9_inverse_transform_b_4x4(xd, xd->eobs[i], xd->block[i].dqcoeff,
                                 xd->block[i].diff, 16);
   }
 }

 void vp9_inverse_transform_mb_4x4(MACROBLOCKD *xd) {
   vp9_inverse_transform_mby_4x4(xd);
   vp9_inverse_transform_mbuv_4x4(xd);
 }

 void vp9_inverse_transform_b_8x8(int16_t *input_dqcoeff, int16_t *output_coeff,
                                  int pitch) {
   vp9_short_idct8x8(input_dqcoeff, output_coeff, pitch);
 }

 void vp9_inverse_transform_mby_8x8(MACROBLOCKD *xd) {
   int i;
   BLOCKD *blockd = xd->block;

   for (i = 0; i < 9; i += 8) {
     TX_TYPE tx_type = get_tx_type_8x8(xd, i);
     if (tx_type != DCT_DCT) {
       vp9_short_iht8x8(xd->block[i].dqcoeff, xd->block[i].diff, 16, tx_type);
     } else {
       vp9_inverse_transform_b_8x8(&blockd[i].dqcoeff[0],
                                   &blockd[i].diff[0], 32);
     }
   }
   for (i = 2; i < 11; i += 8) {
     TX_TYPE tx_type = get_tx_type_8x8(xd, i);
     if (tx_type != DCT_DCT) {
       vp9_short_iht8x8(xd->block[i + 2].dqcoeff, xd->block[i].diff,
                            16, tx_type);
     } else {
       vp9_inverse_transform_b_8x8(&blockd[i + 2].dqcoeff[0],
                                   &blockd[i].diff[0], 32);
     }
   }
 }

 void vp9_inverse_transform_mbuv_8x8(MACROBLOCKD *xd) {
   int i;
   BLOCKD *blockd = xd->block;

   for (i = 16; i < 24; i += 4) {
     vp9_inverse_transform_b_8x8(&blockd[i].dqcoeff[0],
                                 &blockd[i].diff[0], 16);
   }
 }

 void vp9_inverse_transform_mb_8x8(MACROBLOCKD *xd) {
   vp9_inverse_transform_mby_8x8(xd);
   vp9_inverse_transform_mbuv_8x8(xd);
 }

 void vp9_inverse_transform_b_16x16(int16_t *input_dqcoeff,
                                    int16_t *output_coeff, int pitch) {
   vp9_short_idct16x16(input_dqcoeff, output_coeff, pitch);
 }

 void vp9_inverse_transform_mby_16x16(MACROBLOCKD *xd) {
   BLOCKD *bd = &xd->block[0];
   TX_TYPE tx_type = get_tx_type_16x16(xd, 0);
   if (tx_type != DCT_DCT) {
     vp9_short_iht16x16(bd->dqcoeff, bd->diff, 16, tx_type);
   } else {
     vp9_inverse_transform_b_16x16(&xd->block[0].dqcoeff[0],
                                   &xd->block[0].diff[0], 32);
   }
 }

 void vp9_inverse_transform_mb_16x16(MACROBLOCKD *xd) {
   vp9_inverse_transform_mby_16x16(xd);
   vp9_inverse_transform_mbuv_8x8(xd);
 }

 void vp9_inverse_transform_sby_32x32(MACROBLOCKD *xd) {
   vp9_short_idct32x32(xd->dqcoeff, xd->diff, 64);
 }

 void vp9_inverse_transform_sby_16x16(MACROBLOCKD *xd) {
   int n;

   for (n = 0; n < 4; n++) {
     const int x_idx = n & 1, y_idx = n >> 1;
     const TX_TYPE tx_type = get_tx_type_16x16(xd, (y_idx * 8 + x_idx) * 4);

     if (tx_type == DCT_DCT) {
       vp9_inverse_transform_b_16x16(xd->dqcoeff + n * 256,
                                     xd->diff + x_idx * 16 + y_idx * 32 * 16,
                                     64);
     } else {
       vp9_short_iht16x16(xd->dqcoeff + n * 256,
                          xd->diff + x_idx * 16 + y_idx * 32 * 16, 32, tx_type);
     }
   }
 }

 void vp9_inverse_transform_sby_8x8(MACROBLOCKD *xd) {
   int n;

   for (n = 0; n < 16; n++) {
     const int x_idx = n & 3, y_idx = n >> 2;
     const TX_TYPE tx_type = get_tx_type_8x8(xd, (y_idx * 8 + x_idx) * 2);

     if (tx_type == DCT_DCT) {
       vp9_inverse_transform_b_8x8(xd->dqcoeff + n * 64,
                                   xd->diff + x_idx * 8 + y_idx * 32 * 8, 64);
     } else {
       vp9_short_iht8x8(xd->dqcoeff + n * 64,
                        xd->diff + x_idx * 8 + y_idx * 32 * 8, 32, tx_type);
     }
   }
 }

 void vp9_inverse_transform_sby_4x4(MACROBLOCKD *xd) {
   int n;

   for (n = 0; n < 64; n++) {
     const int x_idx = n & 7, y_idx = n >> 3;
     const TX_TYPE tx_type = get_tx_type_4x4(xd, y_idx * 8 + x_idx);

     if (tx_type == DCT_DCT) {
       vp9_inverse_transform_b_4x4(xd, xd->eobs[n], xd->dqcoeff + n * 16,
                                   xd->diff + x_idx * 4 + y_idx * 4 * 32, 64);
     } else {
       vp9_short_iht4x4(xd->dqcoeff + n * 16,
                        xd->diff + x_idx * 4 + y_idx * 4 * 32, 32, tx_type);
     }
   }
 }

 void vp9_inverse_transform_sbuv_16x16(MACROBLOCKD *xd) {
   vp9_inverse_transform_b_16x16(xd->dqcoeff + 1024,
                                 xd->diff + 1024, 32);
   vp9_inverse_transform_b_16x16(xd->dqcoeff + 1280,
                                 xd->diff + 1280, 32);
 }

 void vp9_inverse_transform_sbuv_8x8(MACROBLOCKD *xd) {
   int n;

   for (n = 0; n < 4; n++) {
     const int x_idx = n & 1, y_idx = n >> 1;

     vp9_inverse_transform_b_8x8(xd->dqcoeff + 1024 + n * 64,
                                 xd->diff + 1024 + x_idx * 8 + y_idx * 16 * 8,
                                 32);
     vp9_inverse_transform_b_8x8(xd->dqcoeff + 1280 + n * 64,
                                 xd->diff + 1280 + x_idx * 8 + y_idx * 16 * 8,
                                 32);
   }
 }

 void vp9_inverse_transform_sbuv_4x4(MACROBLOCKD *xd) {
   int n;

   for (n = 0; n < 16; n++) {
     const int x_idx = n & 3, y_idx = n >> 2;

     vp9_inverse_transform_b_4x4(xd, xd->eobs[64 + n],
                                 xd->dqcoeff + 1024 + n * 16,
                                 xd->diff + 1024 + x_idx * 4 + y_idx * 16 * 4,
                                 32);
     vp9_inverse_transform_b_4x4(xd, xd->eobs[64 + 16 + n],
                                 xd->dqcoeff + 1280 + n * 16,
                                 xd->diff + 1280 + x_idx * 4 + y_idx * 16 * 4,
                                 32);
   }
 }

 void vp9_inverse_transform_sb64y_32x32(MACROBLOCKD *xd) {
   int n;

   for (n = 0; n < 4; n++) {
     const int x_idx = n & 1, y_idx = n >> 1;

     vp9_short_idct32x32(xd->dqcoeff + n * 1024,
                         xd->diff + x_idx * 32 + y_idx * 32 * 64, 128);
   }
 }

 void vp9_inverse_transform_sb64y_16x16(MACROBLOCKD *xd) {
   int n;

   for (n = 0; n < 16; n++) {
     const int x_idx = n & 3, y_idx = n >> 2;
     const TX_TYPE tx_type = get_tx_type_16x16(xd, (y_idx * 16 + x_idx) * 4);

     if (tx_type == DCT_DCT) {
       vp9_inverse_transform_b_16x16(xd->dqcoeff + n * 256,
                                     xd->diff + x_idx * 16 + y_idx * 64 * 16,
                                     128);
     } else {
       vp9_short_iht16x16(xd->dqcoeff + n * 256,
                          xd->diff + x_idx * 16 + y_idx * 64 * 16, 64, tx_type);
     }
   }
 }

 void vp9_inverse_transform_sb64y_8x8(MACROBLOCKD *xd) {
   int n;

   for (n = 0; n < 64; n++) {
     const int x_idx = n & 7, y_idx = n >> 3;
     const TX_TYPE tx_type = get_tx_type_8x8(xd, (y_idx * 16 + x_idx) * 2);

     if (tx_type == DCT_DCT) {
       vp9_inverse_transform_b_8x8(xd->dqcoeff + n * 64,
                                   xd->diff + x_idx * 8 + y_idx * 64 * 8, 128);
     } else {
       vp9_short_iht8x8(xd->dqcoeff + n * 64,
                        xd->diff + x_idx * 8 + y_idx * 64 * 8, 64, tx_type);
     }
   }
 }

 void vp9_inverse_transform_sb64y_4x4(MACROBLOCKD *xd) {
   int n;

   for (n = 0; n < 256; n++) {
     const int x_idx = n & 15, y_idx = n >> 4;
     const TX_TYPE tx_type = get_tx_type_4x4(xd, y_idx * 16 + x_idx);

     if (tx_type == DCT_DCT) {
       vp9_inverse_transform_b_4x4(xd, xd->eobs[n], xd->dqcoeff + n * 16,
                                   xd->diff + x_idx * 4 + y_idx * 4 * 64, 128);
     } else {
       vp9_short_iht4x4(xd->dqcoeff + n * 16,
                        xd->diff + x_idx * 4 + y_idx * 4 * 64, 64, tx_type);
     }
   }
 }

 void vp9_inverse_transform_sb64uv_32x32(MACROBLOCKD *xd) {
   vp9_short_idct32x32(xd->dqcoeff + 4096,
                       xd->diff + 4096, 64);
   vp9_short_idct32x32(xd->dqcoeff + 4096 + 1024,
                       xd->diff + 4096 + 1024, 64);
 }

 void vp9_inverse_transform_sb64uv_16x16(MACROBLOCKD *xd) {
   int n;

   for (n = 0; n < 4; n++) {
     const int x_idx = n & 1, y_idx = n >> 1, off = x_idx * 16 + y_idx * 32 * 16;

     vp9_inverse_transform_b_16x16(xd->dqcoeff + 4096 + n * 256,
                                   xd->diff + 4096 + off, 64);
     vp9_inverse_transform_b_16x16(xd->dqcoeff + 4096 + 1024 + n * 256,
                                   xd->diff + 4096 + 1024 + off, 64);
   }
 }

 void vp9_inverse_transform_sb64uv_8x8(MACROBLOCKD *xd) {
   int n;

   for (n = 0; n < 16; n++) {
     const int x_idx = n & 3, y_idx = n >> 2, off = x_idx * 8 + y_idx * 32 * 8;

     vp9_inverse_transform_b_8x8(xd->dqcoeff + 4096 + n * 64,
                                 xd->diff + 4096 + off, 64);
     vp9_inverse_transform_b_8x8(xd->dqcoeff + 4096 + 1024 + n * 64,
                                 xd->diff + 4096 + 1024 + off, 64);
   }
 }

 void vp9_inverse_transform_sb64uv_4x4(MACROBLOCKD *xd) {
   int n;

   for (n = 0; n < 64; n++) {
     const int x_idx = n & 7, y_idx = n >> 3, off = x_idx * 4 + y_idx * 32 * 4;

     vp9_inverse_transform_b_4x4(xd, xd->eobs[256 + n],
                                 xd->dqcoeff + 4096 + n * 16,
                                 xd->diff + 4096 + off, 64);
     vp9_inverse_transform_b_4x4(xd, xd->eobs[256 + 64 + n],
                                 xd->dqcoeff + 4096 + 1024 + n * 16,
                                 xd->diff + 4096 + 1024 + off, 64);
   }
 }
	/*
	* Copyright (c) 2010 The WebM project authors. All Rights Reserved.
	*
	* Use of this source code is governed by a BSD-style license
	* that can be found in the LICENSE file in the root of the source
	* tree. An additional intellectual property rights grant can be found
	* in the file PATENTS. All contributing project authors may
	* be found in the AUTHORS file in the root of the source tree.
	*/

	#include "vp9/common/vp9_invtrans.h"
	#include "./vp9_rtcd.h"

	void vp9_inverse_transform_b_4x4(MACROBLOCKD *xd, int eob,
	int16_t dqcoeff, int16_t diff,
	int pitch) {
	if (eob <= 1)
	xd->inv_txm4x4_1(dqcoeff, diff, pitch);
	else
	xd->inv_txm4x4(dqcoeff, diff, pitch);
	}

	void vp9_inverse_transform_mby_4x4(MACROBLOCKD *xd) {
	int i;

	for (i = 0; i < 16; i++) {
	TX_TYPE tx_type = get_tx_type_4x4(xd, i);
	if (tx_type != DCT_DCT) {
	vp9_short_iht4x4(xd->block[i].dqcoeff, xd->block[i].diff, 16, tx_type);
	} else {
	vp9_inverse_transform_b_4x4(xd, xd->eobs[i], xd->block[i].dqcoeff,
	xd->block[i].diff, 32);
	}
	}
	}

	void vp9_inverse_transform_mbuv_4x4(MACROBLOCKD *xd) {
	int i;

	for (i = 16; i < 24; i++) {
	vp9_inverse_transform_b_4x4(xd, xd->eobs[i], xd->block[i].dqcoeff,
	xd->block[i].diff, 16);
	}
	}

	void vp9_inverse_transform_mb_4x4(MACROBLOCKD *xd) {
	vp9_inverse_transform_mby_4x4(xd);
	vp9_inverse_transform_mbuv_4x4(xd);
	}

	void vp9_inverse_transform_b_8x8(int16_t input_dqcoeff, int16_t output_coeff,
	int pitch) {
	vp9_short_idct8x8(input_dqcoeff, output_coeff, pitch);
	}

	void vp9_inverse_transform_mby_8x8(MACROBLOCKD *xd) {
	int i;
	BLOCKD *blockd = xd->block;

	for (i = 0; i < 9; i += 8) {
	TX_TYPE tx_type = get_tx_type_8x8(xd, i);
	if (tx_type != DCT_DCT) {
	vp9_short_iht8x8(xd->block[i].dqcoeff, xd->block[i].diff, 16, tx_type);
	} else {
	vp9_inverse_transform_b_8x8(&blockd[i].dqcoeff[0],
	&blockd[i].diff[0], 32);
	}
	}
	for (i = 2; i < 11; i += 8) {
	TX_TYPE tx_type = get_tx_type_8x8(xd, i);
	if (tx_type != DCT_DCT) {
	vp9_short_iht8x8(xd->block[i + 2].dqcoeff, xd->block[i].diff,
	16, tx_type);
	} else {
	vp9_inverse_transform_b_8x8(&blockd[i + 2].dqcoeff[0],
	&blockd[i].diff[0], 32);
	}
	}
	}

	void vp9_inverse_transform_mbuv_8x8(MACROBLOCKD *xd) {
	int i;
	BLOCKD *blockd = xd->block;

	for (i = 16; i < 24; i += 4) {
	vp9_inverse_transform_b_8x8(&blockd[i].dqcoeff[0],
	&blockd[i].diff[0], 16);
	}
	}

	void vp9_inverse_transform_mb_8x8(MACROBLOCKD *xd) {
	vp9_inverse_transform_mby_8x8(xd);
	vp9_inverse_transform_mbuv_8x8(xd);
	}

	void vp9_inverse_transform_b_16x16(int16_t *input_dqcoeff,
	int16_t *output_coeff, int pitch) {
	vp9_short_idct16x16(input_dqcoeff, output_coeff, pitch);
	}

	void vp9_inverse_transform_mby_16x16(MACROBLOCKD *xd) {
	BLOCKD *bd = &xd->block[0];
	TX_TYPE tx_type = get_tx_type_16x16(xd, 0);
	if (tx_type != DCT_DCT) {
	vp9_short_iht16x16(bd->dqcoeff, bd->diff, 16, tx_type);
	} else {
	vp9_inverse_transform_b_16x16(&xd->block[0].dqcoeff[0],
	&xd->block[0].diff[0], 32);
	}
	}

	void vp9_inverse_transform_mb_16x16(MACROBLOCKD *xd) {
	vp9_inverse_transform_mby_16x16(xd);
	vp9_inverse_transform_mbuv_8x8(xd);
	}

	void vp9_inverse_transform_sby_32x32(MACROBLOCKD *xd) {
	vp9_short_idct32x32(xd->dqcoeff, xd->diff, 64);
	}

	void vp9_inverse_transform_sby_16x16(MACROBLOCKD *xd) {
	int n;

	for (n = 0; n < 4; n++) {
	const int x_idx = n & 1, y_idx = n >> 1;
	const TX_TYPE tx_type = get_tx_type_16x16(xd, (y_idx * 8 + x_idx) * 4);

	if (tx_type == DCT_DCT) {
	vp9_inverse_transform_b_16x16(xd->dqcoeff + n * 256,
	xd->diff + x_idx * 16 + y_idx * 32 * 16,
	64);
	} else {
	vp9_short_iht16x16(xd->dqcoeff + n * 256,
	xd->diff + x_idx * 16 + y_idx * 32 * 16, 32, tx_type);
	}
	}
	}

	void vp9_inverse_transform_sby_8x8(MACROBLOCKD *xd) {
	int n;

	for (n = 0; n < 16; n++) {
	const int x_idx = n & 3, y_idx = n >> 2;
	const TX_TYPE tx_type = get_tx_type_8x8(xd, (y_idx * 8 + x_idx) * 2);

	if (tx_type == DCT_DCT) {
	vp9_inverse_transform_b_8x8(xd->dqcoeff + n * 64,
	xd->diff + x_idx * 8 + y_idx * 32 * 8, 64);
	} else {
	vp9_short_iht8x8(xd->dqcoeff + n * 64,
	xd->diff + x_idx * 8 + y_idx * 32 * 8, 32, tx_type);
	}
	}
	}

	void vp9_inverse_transform_sby_4x4(MACROBLOCKD *xd) {
	int n;

	for (n = 0; n < 64; n++) {
	const int x_idx = n & 7, y_idx = n >> 3;
	const TX_TYPE tx_type = get_tx_type_4x4(xd, y_idx * 8 + x_idx);

	if (tx_type == DCT_DCT) {
	vp9_inverse_transform_b_4x4(xd, xd->eobs[n], xd->dqcoeff + n * 16,
	xd->diff + x_idx * 4 + y_idx * 4 * 32, 64);
	} else {
	vp9_short_iht4x4(xd->dqcoeff + n * 16,
	xd->diff + x_idx * 4 + y_idx * 4 * 32, 32, tx_type);
	}
	}
	}

	void vp9_inverse_transform_sbuv_16x16(MACROBLOCKD *xd) {
	vp9_inverse_transform_b_16x16(xd->dqcoeff + 1024,
	xd->diff + 1024, 32);
	vp9_inverse_transform_b_16x16(xd->dqcoeff + 1280,
	xd->diff + 1280, 32);
	}

	void vp9_inverse_transform_sbuv_8x8(MACROBLOCKD *xd) {
	int n;

	for (n = 0; n < 4; n++) {
	const int x_idx = n & 1, y_idx = n >> 1;

	vp9_inverse_transform_b_8x8(xd->dqcoeff + 1024 + n * 64,
	xd->diff + 1024 + x_idx * 8 + y_idx * 16 * 8,
	32);
	vp9_inverse_transform_b_8x8(xd->dqcoeff + 1280 + n * 64,
	xd->diff + 1280 + x_idx * 8 + y_idx * 16 * 8,
	32);
	}
	}

	void vp9_inverse_transform_sbuv_4x4(MACROBLOCKD *xd) {
	int n;

	for (n = 0; n < 16; n++) {
	const int x_idx = n & 3, y_idx = n >> 2;

	vp9_inverse_transform_b_4x4(xd, xd->eobs[64 + n],
	xd->dqcoeff + 1024 + n * 16,
	xd->diff + 1024 + x_idx * 4 + y_idx * 16 * 4,
	32);
	vp9_inverse_transform_b_4x4(xd, xd->eobs[64 + 16 + n],
	xd->dqcoeff + 1280 + n * 16,
	xd->diff + 1280 + x_idx * 4 + y_idx * 16 * 4,
	32);
	}
	}

	void vp9_inverse_transform_sb64y_32x32(MACROBLOCKD *xd) {
	int n;

	for (n = 0; n < 4; n++) {
	const int x_idx = n & 1, y_idx = n >> 1;

	vp9_short_idct32x32(xd->dqcoeff + n * 1024,
	xd->diff + x_idx * 32 + y_idx * 32 * 64, 128);
	}
	}

	void vp9_inverse_transform_sb64y_16x16(MACROBLOCKD *xd) {
	int n;

	for (n = 0; n < 16; n++) {
	const int x_idx = n & 3, y_idx = n >> 2;
	const TX_TYPE tx_type = get_tx_type_16x16(xd, (y_idx * 16 + x_idx) * 4);

	if (tx_type == DCT_DCT) {
	vp9_inverse_transform_b_16x16(xd->dqcoeff + n * 256,
	xd->diff + x_idx * 16 + y_idx * 64 * 16,
	128);
	} else {
	vp9_short_iht16x16(xd->dqcoeff + n * 256,
	xd->diff + x_idx * 16 + y_idx * 64 * 16, 64, tx_type);
	}
	}
	}

	void vp9_inverse_transform_sb64y_8x8(MACROBLOCKD *xd) {
	int n;

	for (n = 0; n < 64; n++) {
	const int x_idx = n & 7, y_idx = n >> 3;
	const TX_TYPE tx_type = get_tx_type_8x8(xd, (y_idx * 16 + x_idx) * 2);

	if (tx_type == DCT_DCT) {
	vp9_inverse_transform_b_8x8(xd->dqcoeff + n * 64,
	xd->diff + x_idx * 8 + y_idx * 64 * 8, 128);
	} else {
	vp9_short_iht8x8(xd->dqcoeff + n * 64,
	xd->diff + x_idx * 8 + y_idx * 64 * 8, 64, tx_type);
	}
	}
	}

	void vp9_inverse_transform_sb64y_4x4(MACROBLOCKD *xd) {
	int n;

	for (n = 0; n < 256; n++) {
	const int x_idx = n & 15, y_idx = n >> 4;
	const TX_TYPE tx_type = get_tx_type_4x4(xd, y_idx * 16 + x_idx);

	if (tx_type == DCT_DCT) {
	vp9_inverse_transform_b_4x4(xd, xd->eobs[n], xd->dqcoeff + n * 16,
	xd->diff + x_idx * 4 + y_idx * 4 * 64, 128);
	} else {
	vp9_short_iht4x4(xd->dqcoeff + n * 16,
	xd->diff + x_idx * 4 + y_idx * 4 * 64, 64, tx_type);
	}
	}
	}

	void vp9_inverse_transform_sb64uv_32x32(MACROBLOCKD *xd) {
	vp9_short_idct32x32(xd->dqcoeff + 4096,
	xd->diff + 4096, 64);
	vp9_short_idct32x32(xd->dqcoeff + 4096 + 1024,
	xd->diff + 4096 + 1024, 64);
	}

	void vp9_inverse_transform_sb64uv_16x16(MACROBLOCKD *xd) {
	int n;

	for (n = 0; n < 4; n++) {
	const int x_idx = n & 1, y_idx = n >> 1, off = x_idx * 16 + y_idx * 32 * 16;

	vp9_inverse_transform_b_16x16(xd->dqcoeff + 4096 + n * 256,
	xd->diff + 4096 + off, 64);
	vp9_inverse_transform_b_16x16(xd->dqcoeff + 4096 + 1024 + n * 256,
	xd->diff + 4096 + 1024 + off, 64);
	}
	}

	void vp9_inverse_transform_sb64uv_8x8(MACROBLOCKD *xd) {
	int n;

	for (n = 0; n < 16; n++) {
	const int x_idx = n & 3, y_idx = n >> 2, off = x_idx * 8 + y_idx * 32 * 8;

	vp9_inverse_transform_b_8x8(xd->dqcoeff + 4096 + n * 64,
	xd->diff + 4096 + off, 64);
	vp9_inverse_transform_b_8x8(xd->dqcoeff + 4096 + 1024 + n * 64,
	xd->diff + 4096 + 1024 + off, 64);
	}
	}

	void vp9_inverse_transform_sb64uv_4x4(MACROBLOCKD *xd) {
	int n;

	for (n = 0; n < 64; n++) {
	const int x_idx = n & 7, y_idx = n >> 3, off = x_idx * 4 + y_idx * 32 * 4;

	vp9_inverse_transform_b_4x4(xd, xd->eobs[256 + n],
	xd->dqcoeff + 4096 + n * 16,
	xd->diff + 4096 + off, 64);
	vp9_inverse_transform_b_4x4(xd, xd->eobs[256 + 64 + n],
	xd->dqcoeff + 4096 + 1024 + n * 16,
	xd->diff + 4096 + 1024 + off, 64);
	}
	}