AVX2: Forced inline sadMxNx4d About 0.3% speed up when compiled with PIC flag. Change-Id: I7b251c13aff41ada27223a2f17a92c4cc561cecf

commit: b00034a4670f14463eb2543e96ccf7722d57abd0 [log] [tgz]
author: chiyotsai <chiyotsai@google.com> Mon Oct 24 14:03:52 2022 -0700
committer: Chi Yo Tsai <chiyotsai@google.com> Tue Oct 25 19:07:00 2022 +0000
tree: 45083a9cf323a9a1d4b168f25fdf9c08eb3801f8
parent: 98ab3000916f52350f6a0259b3998522f65318f8 [diff]
diff --git a/aom_dsp/x86/sad4d_avx2.c b/aom_dsp/x86/sad4d_avx2.c
index 1abeb4c..6ff8155 100644
--- a/aom_dsp/x86/sad4d_avx2.c
+++ b/aom_dsp/x86/sad4d_avx2.c

@@ -14,9 +14,9 @@
 
 #include "aom/aom_integer.h"
 
-void aom_sadMxNx4d_avx2(int M, int N, const uint8_t *src, int src_stride,
-                        const uint8_t *const ref[4], int ref_stride,
-                        uint32_t res[4]) {
+static AOM_FORCE_INLINE void aom_sadMxNx4d_avx2(
+    int M, int N, const uint8_t *src, int src_stride,
+    const uint8_t *const ref[4], int ref_stride, uint32_t res[4]) {
   __m256i src_reg, ref0_reg, ref1_reg, ref2_reg, ref3_reg;
   __m256i sum_ref0, sum_ref1, sum_ref2, sum_ref3;
   int i, j;
commit	b00034a4670f14463eb2543e96ccf7722d57abd0	[log] [tgz]
author	chiyotsai <chiyotsai@google.com>	Mon Oct 24 14:03:52 2022 -0700
committer	Chi Yo Tsai <chiyotsai@google.com>	Tue Oct 25 19:07:00 2022 +0000
tree	45083a9cf323a9a1d4b168f25fdf9c08eb3801f8
parent	98ab3000916f52350f6a0259b3998522f65318f8 [diff]