随着硬件的飞速发展,目前的CPU厂商(Intel、AMD、高通、海思、MTK等)提供的CPU机器均支持SIMD指令,该指令主要用于算法或者代码的向量加速。本文主要针对windows和Linux系统下的Intel和AMD芯片的SIMD指令说明,主要是基于SSE、AVX说明。定点化主要是利用定点化与SSE/AVX组合使用发挥高效的加速效果。
本文主要分为三个步骤进行讲述
1. 第一部分介绍SSE、AVX基本指令的名称构造以及对应的运算含义
2. 第二部分介绍常用的SSE、AVX指令
3. 第三部分针对DNN预测代码使用SSE、AVX优化介绍,以及8bit与16bit定点化操作。
随着硬件的飞速发展,目前的CPU厂商(Intel、AMD、高通、海思、MTK等)提供的CPU机器均支持SIMD指令,该指令主要用于算法或者代码的向量加速。本文主要针对windows和Linux系统下的Intel和AMD芯片的SIMD指令说明,主要是基于SSE、AVX说明。定点化主要是利用定点化与SSE/AVX组合使用发挥高效的加速效果。
本文主要分为三个步骤进行讲述
1. 第一部分介绍SSE、AVX基本指令的名称构造以及对应的运算含义
2. 第二部分介绍常用的SSE、AVX指令
3. 第三部分针对DNN预测代码使用SSE、AVX优化介绍,以及8bit与16bit定点化操作。