Use veqq_s32 for comparing int32x4. PiperOrigin-RevId: 274589060

commit: c958fbac7737142ca68bee61a32c8c40f4370bb8 [log] [tgz]
author: Jian Li <jianlijianli@google.com> Mon Oct 14 08:59:10 2019 -0700
committer: TensorFlower Gardener <gardener@tensorflow.org> Mon Oct 14 15:24:35 2019 -0700
tree: 90b63be764824993be24ccd23863ecdf02e1f4c1
parent: a1f260e5a12967e06584ed3be545f16ab66f9123 [diff]
diff --git a/tensorflow/lite/kernels/internal/optimized/neon_tensor_utils.cc b/tensorflow/lite/kernels/internal/optimized/neon_tensor_utils.cc
index 3b2e1d8..3da37cb 100644
--- a/tensorflow/lite/kernels/internal/optimized/neon_tensor_utils.cc
+++ b/tensorflow/lite/kernels/internal/optimized/neon_tensor_utils.cc

@@ -1620,11 +1620,11 @@
   int v = 0;
   for (; v < postamble_start; v += kInt8ValuesPerNeonVector) {
     const int32x4_t i_x4_int32 = vreinterpretq_s32_s8(vld1q_s8(vector + v));
-    const uint32x4_t cmp_result = vceqq_s8(i_x4_int32, zero_x4_int32);
-    if (vgetq_lane_u8(cmp_result, 0) == 0) return false;
-    if (vgetq_lane_u8(cmp_result, 1) == 0) return false;
-    if (vgetq_lane_u8(cmp_result, 2) == 0) return false;
-    if (vgetq_lane_u8(cmp_result, 3) == 0) return false;
+    const uint32x4_t cmp_result = vceqq_s32(i_x4_int32, zero_x4_int32);
+    if (vgetq_lane_u32(cmp_result, 0) == 0) return false;
+    if (vgetq_lane_u32(cmp_result, 1) == 0) return false;
+    if (vgetq_lane_u32(cmp_result, 2) == 0) return false;
+    if (vgetq_lane_u32(cmp_result, 3) == 0) return false;
   }
   // Postamble loop
   for (; v < v_size; ++v) {
commit	c958fbac7737142ca68bee61a32c8c40f4370bb8	[log] [tgz]
author	Jian Li <jianlijianli@google.com>	Mon Oct 14 08:59:10 2019 -0700
committer	TensorFlower Gardener <gardener@tensorflow.org>	Mon Oct 14 15:24:35 2019 -0700
tree	90b63be764824993be24ccd23863ecdf02e1f4c1
parent	a1f260e5a12967e06584ed3be545f16ab66f9123 [diff]