STM32F4xx属于Cortex M4F架构,带有32位的单精度硬件FPU(Float Point Unit),支持浮点指令集,相对比M0和M3架构,浮点运算性能高出数十倍甚至上百倍。CortexTMM4 FPU是ARMTMFPv4-SP单精度FPU一种实现形式。
启用硬件FPU
(1)通过修改代码实现
若要开启FPU还需要在头文件stm32f4xx.h中定义标示符_FPU_USED的值为1。即在刚才的宏定义下边添加一个宏定义。
(2)通过软件设置实现
点击图标(Options forTarget…),在”Target”选项卡里的“Code Generation”下的“Floating Point Hardware”下拉菜单中选择”Use FPU”。点击”OK“完成设置。经过设置之后,在程序编译时编译器会自动加入宏定义标识符_FPU_USED为1。
DSP库的使用
STM32F4的Cortex-M4内核不仅内置硬件FPU单元,还支持DSP多种指令集,比如支持单周期乘加指令(MAC)、优化的单指令多数据指令(SIMD)等。因此Cortex-M4执行所有的DSP指令集都可以在单周期内完成,而Cortex-M3和M0需要多个指令和多个周期才能完成同样的功能。比如开方运算,M3和M0只能通过迭代法(标准数学函数库)计算,而M4F直接调用VSQRT指令完成。
获取DSP库
从官网上下载http://www.st.com/web/en/catalog/tools/FM147/CL1794/SC961/SS1743/PF257901,并解压。
DSP库简介
DSP库主要包含以下几个分库:
- BasicMathFunctions – 基本数学函数:提供浮点数的各种基本运算函数,如向量加减乘除等运算。
- CommonTables –arm_common_tables.c文件提供位翻转或相关参数表。
- ComplexMathFunctions –复杂数学功能,如向量处理,求模运算的。
- ControllerFunctions –控制功能函数。包括正弦余弦,PID电机控制,矢量Clarke变换,矢量Clarke逆变换等。
- FastMathFunctions –快速数学功能函数。提供了一种快速的近似正弦,余弦和平方根等相比CMSIS计算库要快的数学函数。
- FilteringFunctions –滤波函数功能,主要为FIR和LMS(最小均方根)等滤波函数。
- MatrixFunctions –矩阵处理函数。包括矩阵加法、矩阵初始化、矩阵反、矩阵乘法、矩阵规模、矩阵减法、矩阵转置等函数。
- StatisticsFunctions –统计功能函数。如求平均值、最大值、最小值、计算均方根RMS、计算方差/标准差等。
- SupportFunctions –支持功能函数,如数据拷贝,Q格式和浮点格式相互转换,Q任意格式相互转换。
- TransformFunctions –变换功能。包括复数FFT(CFFT)/复数FFT逆运算(CIFFT)、实数FFT(RFFT)/实数FFT逆运算(RIFFT)、和DCT(离散余弦变换)和配套的初始化函数。
DSP库环境搭建
在设置使用DSP库之前首先要先开启硬件FPU,然后按照如下步骤搭建DSP库运行环境。
然后打开工程,新建DSP_LIB分组,并将arm_cortexM4lf_math.lib添加到工程里面。
将第一步拷贝的Include文件夹和DSP_LIB文件夹,加入头文件包含路径。打开工程属性设置面板,然后点击”C/C++“选项卡,点击对号处,弹出include path设置面板。添加”..\DSP_LIB“。
为了能够使用DSP库的所有功能,还需要添加以下几个全局宏定义:
- ARM_MATH_CM4
- __CC_ARM
- ARM_MATH_MATRIX_CHECK
- ARM_MATH_ROUNDING