src/solaris/native/sun/java2d/loops/mlib_v_ImageLogic.h - toolchain/jdk/jdk9_jdk - Git at Google

 /*
  * Copyright (c) 2003, Oracle and/or its affiliates. All rights reserved.
  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
  *
  * This code is free software; you can redistribute it and/or modify it
  * under the terms of the GNU General Public License version 2 only, as
  * published by the Free Software Foundation.  Oracle designates this
  * particular file as subject to the "Classpath" exception as provided
  * by Oracle in the LICENSE file that accompanied this code.
  *
  * This code is distributed in the hope that it will be useful, but WITHOUT
  * ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
  * FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
  * version 2 for more details (a copy is included in the LICENSE file that
  * accompanied this code).
  *
  * You should have received a copy of the GNU General Public License version
  * 2 along with this work; if not, write to the Free Software Foundation,
  * Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301 USA.
  *
  * Please contact Oracle, 500 Oracle Parkway, Redwood Shores, CA 94065 USA
  * or visit www.oracle.com if you need additional information or have any
  * questions.
  */

 #ifndef __MLIB_V_IMAGELOGIC_H
 #define __MLIB_V_IMAGELOGIC_H


 #include <vis_proto.h>
 #include <mlib_ImageCheck.h>
 #include <mlib_ImageLogic_proto.h>
 #include <mlib_v_ImageLogic_proto.h>

 #ifdef __cplusplus
 extern "C" {
 #endif /* __cplusplus */

 /*
  * Functions for VIS version image logical functions.
  */

 /*
 #if defined ( VIS )
 #if VIS >= 0x200
 #error This include file can be used with VIS 1.0 only
 #endif
 #endif
 */

 static void mlib_v_alligned_dst_src1(mlib_u8  *dp,
                                      mlib_u8  *sp1,
                                      mlib_u8  *sp2,
                                      mlib_s32 amount);

 static void mlib_v_alligned_dst_src2(mlib_u8  *dp,
                                      mlib_u8  *sp1,
                                      mlib_u8  *sp2,
                                      mlib_s32 amount);

 static void mlib_v_alligned_src1_src2(mlib_u8  *dp,
                                       mlib_u8  *sp1,
                                       mlib_u8  *sp2,
                                       mlib_s32 amount);

 static void mlib_v_notalligned(mlib_u8  *dp,
                                mlib_u8  *sp1,
                                mlib_u8  *sp2,
                                mlib_s32 amount);

 /***************************************************************/

 #define VALIDATE()                                                      \
   mlib_u8  *sp1, *sl1; /* pointers for pixel and line of source */      \
   mlib_u8  *sp2, *sl2; /* pointers for pixel and line of source */      \
   mlib_u8  *dp,  *dl;  /* pointers for pixel and line of dst */         \
   mlib_s32 width, height, channels, type;                               \
   mlib_s32 stride1;  /* for src1 */                                     \
   mlib_s32 stride2;  /* for src2 */                                     \
   mlib_s32 strided;  /* for dst */                                      \
                                                                         \
   MLIB_IMAGE_SIZE_EQUAL(dst,src1);                                      \
   MLIB_IMAGE_TYPE_EQUAL(dst,src1);                                      \
   MLIB_IMAGE_CHAN_EQUAL(dst,src1);                                      \
                                                                         \
   MLIB_IMAGE_SIZE_EQUAL(dst,src2);                                      \
   MLIB_IMAGE_TYPE_EQUAL(dst,src2);                                      \
   MLIB_IMAGE_CHAN_EQUAL(dst,src2);                                      \
                                                                         \
   dp  = (mlib_u8*) mlib_ImageGetData(dst);                              \
   sp1 = (mlib_u8*) mlib_ImageGetData(src1);                             \
   sp2 = (mlib_u8*) mlib_ImageGetData(src2);                             \
   height = mlib_ImageGetHeight(dst);                                    \
   width  = mlib_ImageGetWidth(dst);                                     \
   stride1 = mlib_ImageGetStride(src1);                                  \
   stride2 = mlib_ImageGetStride(src2);                                  \
   strided  = mlib_ImageGetStride(dst);                                  \
   channels    = mlib_ImageGetChannels(dst);                             \
   type = mlib_ImageGetType(dst);                                        \
                                                                         \
   if (type == MLIB_SHORT) {                                             \
     width *= 2;                                                         \
   } else if (type == MLIB_INT) {                                        \
     width *= 4;                                                         \
   }

 /***************************************************************/

 static mlib_status mlib_v_ImageLogic(mlib_image *dst,
                                      mlib_image *src1,
                                      mlib_image *src2)
 {
   mlib_s32 i, j;
   mlib_s32 offdst, offsrc1, offsrc2 , mask, emask;
   mlib_s32 amount;
   mlib_d64 *dpp, *spp2 , *spp1;
   mlib_d64 dd, sd10, sd20;
   mlib_u8* dend;

   VALIDATE();

   amount = width * channels;

   if (stride1 == amount && stride2 == amount && strided == amount) {

     amount *= height;
     offdst = ((mlib_addr)dp) & 7;
     offsrc1 = (( mlib_addr)sp1) & 7;
     offsrc2 = (( mlib_addr)sp2) & 7 ;
     mask = ((offsrc1 ^ offsrc2) << 8) |
            ((offdst ^ offsrc2) << 4)   | (offdst ^ offsrc1);

     if (mask == 0) { /* offdst = offsrc1 = offsrc2 */

 /* prepare the destination addresses */
       dpp = (mlib_d64 *) vis_alignaddr(dp, 0);
       i = (mlib_u8*)dpp - dp;

 /* prepare the source addresses */
       spp1 = (mlib_d64 *) vis_alignaddr(sp1, 0);
       spp2 = (mlib_d64 *) vis_alignaddr(sp2, 0);

       dend  = dp + amount - 1;
 /* generate edge mask for the start point */
       emask = vis_edge8(dp, dend);

       if (emask != 0xff) {
         sd10 = *spp1++; sd20 = *spp2++;
         dd = VIS_LOGIC(sd20, sd10);
         vis_pst_8(dd, dpp++, emask);
         i += 8;
       }

 #pragma pipeloop(0)
       for ( ; i <= amount - 8; i += 8) {
         sd10 = *spp1++; sd20 = *spp2++;
         *dpp++ = VIS_LOGIC(sd20, sd10);
       }

       if (i < amount)  {
         emask = vis_edge8(dpp, dend);
         sd10 = *spp1++; sd20 = *spp2++;
         dd = VIS_LOGIC(sd20, sd10);
         vis_pst_8(dd, dpp, emask);
       }

     } else if ((mask & 0xF) == 0) { /* offdst = offsrc1 != offsrc2 */

       mlib_v_alligned_dst_src1(dp, sp1, sp2, amount);

     } else if ((mask & 0xF0) == 0) { /* offdst = offsrc2 != offsrc1 */

       mlib_v_alligned_dst_src2(dp, sp1, sp2, amount);

     } else if ((mask & 0xF00) == 0) { /* offsrc1 = offsrc2 != offdst */

       mlib_v_alligned_src1_src2(dp, sp1, sp2, amount);

     } else {                       /* offdst != offsrc1 != offsrc2 */

       mlib_v_notalligned(dp, sp1, sp2, amount);
     }
   }
   else {

     sl1 = sp1 ;
     sl2 = sp2 ;
     dl = dp ;

     offdst = ((mlib_addr)dp) & 7;
     offsrc1 = (( mlib_addr)sp1) & 7;
     offsrc2 = (( mlib_addr)sp2) & 7 ;

     if ((offdst == offsrc1) && (offdst == offsrc2) &&
         ((strided & 7) == (stride1 & 7)) &&
         ((strided & 7) == (stride2 & 7))) {

       for (j = 0; j < height; j ++ ) {

 /* prepare the destination addresses */
         dpp = (mlib_d64 *) vis_alignaddr(dp, 0);
         i = (mlib_u8*)dpp - dp;

 /* prepare the source addresses */
         spp1 = (mlib_d64 *) vis_alignaddr(sp1, 0);
         spp2 = (mlib_d64 *) vis_alignaddr(sp2, 0);

         dend  = dp + amount - 1;
 /* generate edge mask for the start point */
         emask = vis_edge8(dp, dend);

         if (emask != 0xff) {
           sd10 = *spp1++; sd20 = *spp2++;
           dd = VIS_LOGIC(sd20, sd10);
           vis_pst_8(dd, dpp++, emask);
           i += 8;
         }

 #pragma pipeloop(0)
         for ( ; i <= amount - 8; i += 8) {
           sd10 = *spp1++; sd20 = *spp2++;
           *dpp++ = VIS_LOGIC(sd20, sd10);
         }

         if (i < amount)  {
           emask = vis_edge8(dpp, dend);
           sd10 = *spp1++; sd20 = *spp2++;
           dd = VIS_LOGIC(sd20, sd10);
           vis_pst_8(dd, dpp, emask);
         }

         sp1 = sl1 += stride1 ;
         sp2 = sl2 += stride2 ;
         dp = dl += strided ;
       }

    } else if ((offdst == offsrc1) &&
              ((strided & 7) == (stride1 & 7))) {

       for (j = 0; j < height; j ++ ) {
         mlib_v_alligned_dst_src1(dp, sp1, sp2, amount);

         sp1 = sl1 += stride1 ;
         sp2 = sl2 += stride2 ;
         dp = dl += strided ;
       }

    } else if ((offdst == offsrc2) &&
              ((strided & 7) == (stride2 & 7))) {

       for (j = 0; j < height; j ++ ) {
         mlib_v_alligned_dst_src2(dp, sp1, sp2, amount);

         sp1 = sl1 += stride1 ;
         sp2 = sl2 += stride2 ;
         dp = dl += strided ;
       }

    } else if ((offsrc1 == offsrc2) &&
              ((stride1 & 7) == (stride2 & 7))) {

       for (j = 0; j < height; j ++ ) {
         mlib_v_alligned_src1_src2(dp, sp1, sp2, amount);

         sp1 = sl1 += stride1 ;
         sp2 = sl2 += stride2 ;
         dp = dl += strided ;
       }

    } else {

       for (j = 0; j < height; j ++ ) {
         mlib_v_notalligned(dp, sp1, sp2, amount);

         sp1 = sl1 += stride1 ;
         sp2 = sl2 += stride2 ;
         dp = dl += strided ;
       }
     }
   }

   return MLIB_SUCCESS;
 }

 /***************************************************************/

 static void mlib_v_alligned_dst_src1(mlib_u8  *dp,
                                      mlib_u8  *sp1,
                                      mlib_u8  *sp2,
                                      mlib_s32 amount)
 {
   mlib_s32 i;
   mlib_s32 emask;
   mlib_d64 *dpp, *spp2 , *spp1;
   mlib_d64 dd, sd10, sd20, sd21;
   mlib_u8* dend;

 /* prepare the destination addresses */
   dpp = (mlib_d64 *) vis_alignaddr(dp, 0);
   i = (mlib_u8*)dpp - dp;

 /* prepare the source addresses */
   spp1 = (mlib_d64 *) vis_alignaddr(sp1, 0);
   spp2 = (mlib_d64 *) vis_alignaddr(sp2, i);

   dend  = dp + amount - 1;
 /* generate edge mask for the start point */
   emask = vis_edge8(dp, dend);

   sd20 = spp2[0];

   if (emask != 0xff) {
     sd10 = *spp1++; sd21 = spp2[1];
     sd20 = vis_faligndata(sd20, sd21);
     dd = VIS_LOGIC(sd20, sd10);
     vis_pst_8(dd, dpp++, emask);
     sd20 = sd21; spp2++;
     i += 8;
   }

 #pragma pipeloop(0)
   for ( ; i <= amount - 8; i += 8) {
     sd10 = *spp1++; sd21 = spp2[1];
     sd20 = vis_faligndata(sd20, sd21);
     *dpp++ = VIS_LOGIC(sd20, sd10);
     sd20 = sd21; spp2++;
   }

   if (i < amount)  {
     emask = vis_edge8(dpp, dend);
     sd10 = *spp1++;
     sd20 = vis_faligndata(sd20, spp2[1]);
     dd = VIS_LOGIC(sd20, sd10);
     vis_pst_8(dd, dpp, emask);
   }
 }

 /***************************************************************/

 static void mlib_v_alligned_dst_src2(mlib_u8  *dp,
                                      mlib_u8  *sp1,
                                      mlib_u8  *sp2,
                                      mlib_s32 amount)
 {
   mlib_s32 i;
   mlib_s32 emask;
   mlib_d64 *dpp, *spp2 , *spp1;
   mlib_d64 dd, sd10, sd11, sd20;
   mlib_u8* dend;

 /* prepare the destination addresses */
   dpp = (mlib_d64 *) vis_alignaddr(dp, 0);
   i = (mlib_u8*)dpp - dp;

 /* prepare the source addresses */
   spp2 = (mlib_d64 *) vis_alignaddr(sp2, 0);
   spp1 = (mlib_d64 *) vis_alignaddr(sp1, i);

   dend  = dp + amount - 1;
 /* generate edge mask for the start point */
   emask = vis_edge8(dp, dend);

   sd10 = spp1[0];

   if (emask != 0xff) {
     sd20 = *spp2++; sd11 = spp1[1];
     sd10 = vis_faligndata(sd10, sd11);
     dd = VIS_LOGIC(sd20, sd10);
     vis_pst_8(dd, dpp++, emask);
     sd10 = sd11; spp1++;
     i += 8;
   }

 #pragma pipeloop(0)
   for ( ; i <= amount - 8; i += 8) {
     sd20 = *spp2++; sd11 = spp1[1];
     sd10 = vis_faligndata(sd10, sd11);
     *dpp++ = VIS_LOGIC(sd20, sd10);
     sd10 = sd11; spp1++;
   }

   if (i < amount)  {
     emask = vis_edge8(dpp, dend);
     sd20 = *spp2++;
     sd10 = vis_faligndata(sd10, spp1[1]);
     dd = VIS_LOGIC(sd20, sd10);
     vis_pst_8(dd, dpp, emask);
   }
 }

 /***************************************************************/

 static void mlib_v_alligned_src1_src2(mlib_u8  *dp,
                                       mlib_u8  *sp1,
                                       mlib_u8  *sp2,
                                       mlib_s32 amount)
 {
   mlib_s32 i;
   mlib_s32 emask;
   mlib_d64 *dpp, *spp2 , *spp1;
   mlib_d64 dd, sd10, dd0, sd20, dd1;
   mlib_u8* dend;

 /* prepare the source addresses */
   dpp = (mlib_d64 *) vis_alignaddr(dp, 0);
   i = (mlib_u8*)dpp - dp;

 /* prepare the destination addresses */
   spp1 = (mlib_d64 *) vis_alignaddr(sp1, i);
   spp2 = (mlib_d64 *) vis_alignaddr(sp2, i);

   dend  = dp + amount - 1;
 /* generate edge mask for the start point */
   emask = vis_edge8(dp, dend);

   sd10 = *spp1++; sd20 = *spp2++;
   dd0 = VIS_LOGIC(sd20, sd10);

   if (emask != 0xff) {
     sd10 = *spp1++; sd20 = *spp2++;
     dd1 = VIS_LOGIC(sd20, sd10);
     dd = vis_faligndata(dd0, dd1);
     vis_pst_8(dd, dpp++, emask);
     dd0 = dd1;
     i += 8;
   }

 #pragma pipeloop(0)
   for ( ; i <= amount - 8; i += 8) {
     sd10 = *spp1++; sd20 = *spp2++;
     dd1 = VIS_LOGIC(sd20, sd10);
     *dpp++ = vis_faligndata(dd0, dd1);
     dd0 = dd1;
   }

   if (i < amount)  {
     emask = vis_edge8(dpp, dend);
     sd10 = *spp1++; sd20 = *spp2++;
     dd1 = VIS_LOGIC(sd20, sd10);
     dd = vis_faligndata(dd0, dd1);
     vis_pst_8(dd, dpp, emask);
   }
 }

 /***************************************************************/

 static void mlib_v_notalligned(mlib_u8  *dp,
                                mlib_u8  *sp1,
                                mlib_u8  *sp2,
                                mlib_s32 amount)
 {
   mlib_s32 i, k;
   mlib_s32 emask;
   mlib_d64 *dpp, *spp2 , *spp1, *tmp_ptr ;
   mlib_d64 dd, sd10, sd11, sd20, sd21;
   mlib_u8* dend;

 /* prepare the destination addresses */
   dpp = (mlib_d64 *) vis_alignaddr(dp, 0);
   i = (mlib_u8*)dpp - dp;

   dend  = dp + amount - 1;
 /* generate edge mask for the start point */
   emask = vis_edge8(dp, dend);

   if (emask != 0xff) {
     spp1 = (mlib_d64 *) vis_alignaddr(sp1, i);
     sd10 = vis_faligndata(spp1[0], spp1[1]);
     spp2 = (mlib_d64 *) vis_alignaddr(sp2, i);
     sd20 = vis_faligndata(spp2[0], spp2[1]);
     dd = VIS_LOGIC(sd20, sd10);
     vis_pst_8(dd, dpp++, emask);
     i += 8;
   }

 /* copy src1 to dst */
   spp1 = (mlib_d64 *) vis_alignaddr(sp1, i);
   sd11 = spp1[0];
   tmp_ptr = dpp;

 #pragma pipeloop(0)
   for (k = i; k <= (amount - 8); k += 8) {
     sd10 = sd11; sd11 = spp1[1];
     *tmp_ptr++ = vis_faligndata(sd10, sd11);
     spp1++;
   }

   sd11 = vis_faligndata(sd11, spp1[1]);

   spp2 = (mlib_d64 *) vis_alignaddr(sp2, i);
   sd20 = spp2[0];
   tmp_ptr = dpp;

 #pragma pipeloop(0)
   for ( ; i <= amount - 8; i += 8) {
     sd10 = *tmp_ptr++; sd21 = spp2[1];
     sd20 = vis_faligndata(sd20, sd21);
     *dpp++ = VIS_LOGIC(sd20, sd10);
     sd20 = sd21; spp2++;
   }

   if (i < amount)  {
     emask = vis_edge8(dpp, dend);
     sd20 = vis_faligndata(sd20, spp2[1]);
     dd = VIS_LOGIC(sd20, sd11);
     vis_pst_8(dd, dpp, emask);
   }
 }

 /***************************************************************/

 #ifdef __cplusplus
 }
 #endif /* __cplusplus */
 #endif /* __MLIB_V_IMAGELOGIC_H */
	/*
	* Copyright (c) 2003, Oracle and/or its affiliates. All rights reserved.
	* DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
	*
	* This code is free software; you can redistribute it and/or modify it
	* under the terms of the GNU General Public License version 2 only, as
	* published by the Free Software Foundation. Oracle designates this
	* particular file as subject to the "Classpath" exception as provided
	* by Oracle in the LICENSE file that accompanied this code.
	*
	* This code is distributed in the hope that it will be useful, but WITHOUT
	* ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
	* FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
	* version 2 for more details (a copy is included in the LICENSE file that
	* accompanied this code).
	*
	* You should have received a copy of the GNU General Public License version
	* 2 along with this work; if not, write to the Free Software Foundation,
	* Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301 USA.
	*
	* Please contact Oracle, 500 Oracle Parkway, Redwood Shores, CA 94065 USA
	* or visit www.oracle.com if you need additional information or have any
	* questions.
	*/

	#ifndef __MLIB_V_IMAGELOGIC_H
	#define __MLIB_V_IMAGELOGIC_H


	#include <vis_proto.h>
	#include <mlib_ImageCheck.h>
	#include <mlib_ImageLogic_proto.h>
	#include <mlib_v_ImageLogic_proto.h>

	#ifdef __cplusplus
	extern "C" {
	#endif /* __cplusplus */

	/*
	* Functions for VIS version image logical functions.
	*/

	/*
	#if defined ( VIS )
	#if VIS >= 0x200
	#error This include file can be used with VIS 1.0 only
	#endif
	#endif
	*/

	static void mlib_v_alligned_dst_src1(mlib_u8 *dp,
	mlib_u8 *sp1,
	mlib_u8 *sp2,
	mlib_s32 amount);

	static void mlib_v_alligned_dst_src2(mlib_u8 *dp,
	mlib_u8 *sp1,
	mlib_u8 *sp2,
	mlib_s32 amount);

	static void mlib_v_alligned_src1_src2(mlib_u8 *dp,
	mlib_u8 *sp1,
	mlib_u8 *sp2,
	mlib_s32 amount);

	static void mlib_v_notalligned(mlib_u8 *dp,
	mlib_u8 *sp1,
	mlib_u8 *sp2,
	mlib_s32 amount);

	/***************************************************************/

	#define VALIDATE() \
	mlib_u8 sp1, sl1; /* pointers for pixel and line of source */ \
	mlib_u8 sp2, sl2; /* pointers for pixel and line of source */ \
	mlib_u8 dp, dl; /* pointers for pixel and line of dst */ \
	mlib_s32 width, height, channels, type; \
	mlib_s32 stride1; /* for src1 */ \
	mlib_s32 stride2; /* for src2 */ \
	mlib_s32 strided; /* for dst */ \
	\
	MLIB_IMAGE_SIZE_EQUAL(dst,src1); \
	MLIB_IMAGE_TYPE_EQUAL(dst,src1); \
	MLIB_IMAGE_CHAN_EQUAL(dst,src1); \
	\
	MLIB_IMAGE_SIZE_EQUAL(dst,src2); \
	MLIB_IMAGE_TYPE_EQUAL(dst,src2); \
	MLIB_IMAGE_CHAN_EQUAL(dst,src2); \
	\
	dp = (mlib_u8*) mlib_ImageGetData(dst); \
	sp1 = (mlib_u8*) mlib_ImageGetData(src1); \
	sp2 = (mlib_u8*) mlib_ImageGetData(src2); \
	height = mlib_ImageGetHeight(dst); \
	width = mlib_ImageGetWidth(dst); \
	stride1 = mlib_ImageGetStride(src1); \
	stride2 = mlib_ImageGetStride(src2); \
	strided = mlib_ImageGetStride(dst); \
	channels = mlib_ImageGetChannels(dst); \
	type = mlib_ImageGetType(dst); \
	\
	if (type == MLIB_SHORT) { \
	width *= 2; \
	} else if (type == MLIB_INT) { \
	width *= 4; \
	}

	/***************************************************************/

	static mlib_status mlib_v_ImageLogic(mlib_image *dst,
	mlib_image *src1,
	mlib_image *src2)
	{
	mlib_s32 i, j;
	mlib_s32 offdst, offsrc1, offsrc2 , mask, emask;
	mlib_s32 amount;
	mlib_d64 dpp, spp2 , *spp1;
	mlib_d64 dd, sd10, sd20;
	mlib_u8* dend;

	VALIDATE();

	amount = width * channels;

	if (stride1 == amount && stride2 == amount && strided == amount) {

	amount *= height;
	offdst = ((mlib_addr)dp) & 7;
	offsrc1 = (( mlib_addr)sp1) & 7;
	offsrc2 = (( mlib_addr)sp2) & 7 ;
	mask = ((offsrc1 ^ offsrc2) << 8) \|
	((offdst ^ offsrc2) << 4) \| (offdst ^ offsrc1);

	if (mask == 0) { /* offdst = offsrc1 = offsrc2 */

	/* prepare the destination addresses */
	dpp = (mlib_d64 *) vis_alignaddr(dp, 0);
	i = (mlib_u8*)dpp - dp;

	/* prepare the source addresses */
	spp1 = (mlib_d64 *) vis_alignaddr(sp1, 0);
	spp2 = (mlib_d64 *) vis_alignaddr(sp2, 0);

	dend = dp + amount - 1;
	/* generate edge mask for the start point */
	emask = vis_edge8(dp, dend);

	if (emask != 0xff) {
	sd10 = spp1++; sd20 = spp2++;
	dd = VIS_LOGIC(sd20, sd10);
	vis_pst_8(dd, dpp++, emask);
	i += 8;
	}

	#pragma pipeloop(0)
	for ( ; i <= amount - 8; i += 8) {
	sd10 = spp1++; sd20 = spp2++;
	*dpp++ = VIS_LOGIC(sd20, sd10);
	}

	if (i < amount) {
	emask = vis_edge8(dpp, dend);
	sd10 = spp1++; sd20 = spp2++;
	dd = VIS_LOGIC(sd20, sd10);
	vis_pst_8(dd, dpp, emask);
	}

	} else if ((mask & 0xF) == 0) { /* offdst = offsrc1 != offsrc2 */

	mlib_v_alligned_dst_src1(dp, sp1, sp2, amount);

	} else if ((mask & 0xF0) == 0) { /* offdst = offsrc2 != offsrc1 */

	mlib_v_alligned_dst_src2(dp, sp1, sp2, amount);

	} else if ((mask & 0xF00) == 0) { /* offsrc1 = offsrc2 != offdst */

	mlib_v_alligned_src1_src2(dp, sp1, sp2, amount);

	} else { /* offdst != offsrc1 != offsrc2 */

	mlib_v_notalligned(dp, sp1, sp2, amount);
	}
	}
	else {

	sl1 = sp1 ;
	sl2 = sp2 ;
	dl = dp ;

	offdst = ((mlib_addr)dp) & 7;
	offsrc1 = (( mlib_addr)sp1) & 7;
	offsrc2 = (( mlib_addr)sp2) & 7 ;

	if ((offdst == offsrc1) && (offdst == offsrc2) &&
	((strided & 7) == (stride1 & 7)) &&
	((strided & 7) == (stride2 & 7))) {

	for (j = 0; j < height; j ++ ) {

	/* prepare the destination addresses */
	dpp = (mlib_d64 *) vis_alignaddr(dp, 0);
	i = (mlib_u8*)dpp - dp;

	/* prepare the source addresses */
	spp1 = (mlib_d64 *) vis_alignaddr(sp1, 0);
	spp2 = (mlib_d64 *) vis_alignaddr(sp2, 0);

	dend = dp + amount - 1;
	/* generate edge mask for the start point */
	emask = vis_edge8(dp, dend);

	if (emask != 0xff) {
	sd10 = spp1++; sd20 = spp2++;
	dd = VIS_LOGIC(sd20, sd10);
	vis_pst_8(dd, dpp++, emask);
	i += 8;
	}

	#pragma pipeloop(0)
	for ( ; i <= amount - 8; i += 8) {
	sd10 = spp1++; sd20 = spp2++;
	*dpp++ = VIS_LOGIC(sd20, sd10);
	}

	if (i < amount) {
	emask = vis_edge8(dpp, dend);
	sd10 = spp1++; sd20 = spp2++;
	dd = VIS_LOGIC(sd20, sd10);
	vis_pst_8(dd, dpp, emask);
	}

	sp1 = sl1 += stride1 ;
	sp2 = sl2 += stride2 ;
	dp = dl += strided ;
	}

	} else if ((offdst == offsrc1) &&
	((strided & 7) == (stride1 & 7))) {

	for (j = 0; j < height; j ++ ) {
	mlib_v_alligned_dst_src1(dp, sp1, sp2, amount);

	sp1 = sl1 += stride1 ;
	sp2 = sl2 += stride2 ;
	dp = dl += strided ;
	}

	} else if ((offdst == offsrc2) &&
	((strided & 7) == (stride2 & 7))) {

	for (j = 0; j < height; j ++ ) {
	mlib_v_alligned_dst_src2(dp, sp1, sp2, amount);

	sp1 = sl1 += stride1 ;
	sp2 = sl2 += stride2 ;
	dp = dl += strided ;
	}

	} else if ((offsrc1 == offsrc2) &&
	((stride1 & 7) == (stride2 & 7))) {

	for (j = 0; j < height; j ++ ) {
	mlib_v_alligned_src1_src2(dp, sp1, sp2, amount);

	sp1 = sl1 += stride1 ;
	sp2 = sl2 += stride2 ;
	dp = dl += strided ;
	}

	} else {

	for (j = 0; j < height; j ++ ) {
	mlib_v_notalligned(dp, sp1, sp2, amount);

	sp1 = sl1 += stride1 ;
	sp2 = sl2 += stride2 ;
	dp = dl += strided ;
	}
	}
	}

	return MLIB_SUCCESS;
	}

	/***************************************************************/

	static void mlib_v_alligned_dst_src1(mlib_u8 *dp,
	mlib_u8 *sp1,
	mlib_u8 *sp2,
	mlib_s32 amount)
	{
	mlib_s32 i;
	mlib_s32 emask;
	mlib_d64 dpp, spp2 , *spp1;
	mlib_d64 dd, sd10, sd20, sd21;
	mlib_u8* dend;

	/* prepare the destination addresses */
	dpp = (mlib_d64 *) vis_alignaddr(dp, 0);
	i = (mlib_u8*)dpp - dp;

	/* prepare the source addresses */
	spp1 = (mlib_d64 *) vis_alignaddr(sp1, 0);
	spp2 = (mlib_d64 *) vis_alignaddr(sp2, i);

	dend = dp + amount - 1;
	/* generate edge mask for the start point */
	emask = vis_edge8(dp, dend);

	sd20 = spp2[0];

	if (emask != 0xff) {
	sd10 = *spp1++; sd21 = spp2[1];
	sd20 = vis_faligndata(sd20, sd21);
	dd = VIS_LOGIC(sd20, sd10);
	vis_pst_8(dd, dpp++, emask);
	sd20 = sd21; spp2++;
	i += 8;
	}

	#pragma pipeloop(0)
	for ( ; i <= amount - 8; i += 8) {
	sd10 = *spp1++; sd21 = spp2[1];
	sd20 = vis_faligndata(sd20, sd21);
	*dpp++ = VIS_LOGIC(sd20, sd10);
	sd20 = sd21; spp2++;
	}

	if (i < amount) {
	emask = vis_edge8(dpp, dend);
	sd10 = *spp1++;
	sd20 = vis_faligndata(sd20, spp2[1]);
	dd = VIS_LOGIC(sd20, sd10);
	vis_pst_8(dd, dpp, emask);
	}
	}

	/***************************************************************/

	static void mlib_v_alligned_dst_src2(mlib_u8 *dp,
	mlib_u8 *sp1,
	mlib_u8 *sp2,
	mlib_s32 amount)
	{
	mlib_s32 i;
	mlib_s32 emask;
	mlib_d64 dpp, spp2 , *spp1;
	mlib_d64 dd, sd10, sd11, sd20;
	mlib_u8* dend;

	/* prepare the destination addresses */
	dpp = (mlib_d64 *) vis_alignaddr(dp, 0);
	i = (mlib_u8*)dpp - dp;

	/* prepare the source addresses */
	spp2 = (mlib_d64 *) vis_alignaddr(sp2, 0);
	spp1 = (mlib_d64 *) vis_alignaddr(sp1, i);

	dend = dp + amount - 1;
	/* generate edge mask for the start point */
	emask = vis_edge8(dp, dend);

	sd10 = spp1[0];

	if (emask != 0xff) {
	sd20 = *spp2++; sd11 = spp1[1];
	sd10 = vis_faligndata(sd10, sd11);
	dd = VIS_LOGIC(sd20, sd10);
	vis_pst_8(dd, dpp++, emask);
	sd10 = sd11; spp1++;
	i += 8;
	}

	#pragma pipeloop(0)
	for ( ; i <= amount - 8; i += 8) {
	sd20 = *spp2++; sd11 = spp1[1];
	sd10 = vis_faligndata(sd10, sd11);
	*dpp++ = VIS_LOGIC(sd20, sd10);
	sd10 = sd11; spp1++;
	}

	if (i < amount) {
	emask = vis_edge8(dpp, dend);
	sd20 = *spp2++;
	sd10 = vis_faligndata(sd10, spp1[1]);
	dd = VIS_LOGIC(sd20, sd10);
	vis_pst_8(dd, dpp, emask);
	}
	}

	/***************************************************************/

	static void mlib_v_alligned_src1_src2(mlib_u8 *dp,
	mlib_u8 *sp1,
	mlib_u8 *sp2,
	mlib_s32 amount)
	{
	mlib_s32 i;
	mlib_s32 emask;
	mlib_d64 dpp, spp2 , *spp1;
	mlib_d64 dd, sd10, dd0, sd20, dd1;
	mlib_u8* dend;

	/* prepare the source addresses */
	dpp = (mlib_d64 *) vis_alignaddr(dp, 0);
	i = (mlib_u8*)dpp - dp;

	/* prepare the destination addresses */
	spp1 = (mlib_d64 *) vis_alignaddr(sp1, i);
	spp2 = (mlib_d64 *) vis_alignaddr(sp2, i);

	dend = dp + amount - 1;
	/* generate edge mask for the start point */
	emask = vis_edge8(dp, dend);

	sd10 = spp1++; sd20 = spp2++;
	dd0 = VIS_LOGIC(sd20, sd10);

	if (emask != 0xff) {
	sd10 = spp1++; sd20 = spp2++;
	dd1 = VIS_LOGIC(sd20, sd10);
	dd = vis_faligndata(dd0, dd1);
	vis_pst_8(dd, dpp++, emask);
	dd0 = dd1;
	i += 8;
	}

	#pragma pipeloop(0)
	for ( ; i <= amount - 8; i += 8) {
	sd10 = spp1++; sd20 = spp2++;
	dd1 = VIS_LOGIC(sd20, sd10);
	*dpp++ = vis_faligndata(dd0, dd1);
	dd0 = dd1;
	}

	if (i < amount) {
	emask = vis_edge8(dpp, dend);
	sd10 = spp1++; sd20 = spp2++;
	dd1 = VIS_LOGIC(sd20, sd10);
	dd = vis_faligndata(dd0, dd1);
	vis_pst_8(dd, dpp, emask);
	}
	}

	/***************************************************************/

	static void mlib_v_notalligned(mlib_u8 *dp,
	mlib_u8 *sp1,
	mlib_u8 *sp2,
	mlib_s32 amount)
	{
	mlib_s32 i, k;
	mlib_s32 emask;
	mlib_d64 dpp, spp2 , spp1, tmp_ptr ;
	mlib_d64 dd, sd10, sd11, sd20, sd21;
	mlib_u8* dend;

	/* prepare the destination addresses */
	dpp = (mlib_d64 *) vis_alignaddr(dp, 0);
	i = (mlib_u8*)dpp - dp;

	dend = dp + amount - 1;
	/* generate edge mask for the start point */
	emask = vis_edge8(dp, dend);

	if (emask != 0xff) {
	spp1 = (mlib_d64 *) vis_alignaddr(sp1, i);
	sd10 = vis_faligndata(spp1[0], spp1[1]);
	spp2 = (mlib_d64 *) vis_alignaddr(sp2, i);
	sd20 = vis_faligndata(spp2[0], spp2[1]);
	dd = VIS_LOGIC(sd20, sd10);
	vis_pst_8(dd, dpp++, emask);
	i += 8;
	}

	/* copy src1 to dst */
	spp1 = (mlib_d64 *) vis_alignaddr(sp1, i);
	sd11 = spp1[0];
	tmp_ptr = dpp;

	#pragma pipeloop(0)
	for (k = i; k <= (amount - 8); k += 8) {
	sd10 = sd11; sd11 = spp1[1];
	*tmp_ptr++ = vis_faligndata(sd10, sd11);
	spp1++;
	}

	sd11 = vis_faligndata(sd11, spp1[1]);

	spp2 = (mlib_d64 *) vis_alignaddr(sp2, i);
	sd20 = spp2[0];
	tmp_ptr = dpp;

	#pragma pipeloop(0)
	for ( ; i <= amount - 8; i += 8) {
	sd10 = *tmp_ptr++; sd21 = spp2[1];
	sd20 = vis_faligndata(sd20, sd21);
	*dpp++ = VIS_LOGIC(sd20, sd10);
	sd20 = sd21; spp2++;
	}

	if (i < amount) {
	emask = vis_edge8(dpp, dend);
	sd20 = vis_faligndata(sd20, spp2[1]);
	dd = VIS_LOGIC(sd20, sd11);
	vis_pst_8(dd, dpp, emask);
	}
	}

	/***************************************************************/

	#ifdef __cplusplus
	}
	#endif /* __cplusplus */
	#endif /* __MLIB_V_IMAGELOGIC_H */