Go to the documentation of this file.00001
00002
00003
00004
00005
00006
00007
00008
00009
00010
00011
00012
00013
00014
00015
00016
00017
00018
00019
00020
00021
00022
00023
00024 #include "arm_math.h"
00025
00053 void arm_dot_prod_q31(
00054 q31_t * pSrcA,
00055 q31_t * pSrcB,
00056 uint32_t blockSize,
00057 q63_t * result)
00058 {
00059 q63_t sum = 0, sum1 = 0;
00060 uint32_t blkCnt;
00061 q31_t inA1, inA2, inB1, inB2;
00062
00063
00064 blkCnt = blockSize >> 3u;
00065
00066
00067
00068 while(blkCnt > 0u)
00069 {
00070
00071
00072
00073
00074 inA1 = *pSrcA;
00075
00076 inB1 = *pSrcB;
00077 inA2 = *(pSrcA + 1);
00078 inB2 = *(pSrcB + 1);
00079
00080
00081 sum += ((q63_t)inA1 * inB1) >> 14u;
00082 sum1 += ((q63_t)inA2 * inB2) >> 14u;
00083
00084 inA1 = *(pSrcA + 2);
00085 inB1 = *(pSrcB + 2);
00086 inA2 = *(pSrcA + 3);
00087 inB2 = *(pSrcB + 3);
00088
00089 sum += ((q63_t)inA1 * inB1) >> 14u;
00090 sum1 += ((q63_t)inA2 * inB2) >> 14u;
00091
00092 inA1 = *(pSrcA + 4);
00093 inB1 = *(pSrcB + 4);
00094 inA2 = *(pSrcA + 5);
00095 inB2 = *(pSrcB + 5);
00096
00097 sum += ((q63_t)inA1 * inB1) >> 14u;
00098 sum1 += ((q63_t)inA2 * inB2) >> 14u;
00099
00100 inA1 = *(pSrcA + 6);
00101 inB1 = *(pSrcB + 6);
00102 inA2 = *(pSrcA + 7);
00103 inB2 = *(pSrcB + 7);
00104
00105 sum += ((q63_t)inA1 * inB1) >> 14u;
00106 sum1 += ((q63_t)inA2 * inB2) >> 14u;
00107
00108
00109 pSrcA += 8u;
00110
00111 pSrcB += 8u;
00112
00113
00114 blkCnt--;
00115 }
00116 sum = sum + sum1;
00117
00118
00119 blkCnt = blockSize % 0x8u;
00120
00121 while(blkCnt > 0u)
00122 {
00123
00124
00125 sum += ((q63_t) * pSrcA++ * *pSrcB++) >> 14u;
00126
00127
00128 blkCnt--;
00129 }
00130
00131
00132 *result = sum;
00133 }
00134