第六章 STM32Cube固件包​


第四章我们通过STM32CubeIDE在线下载了一个STM32Cube固件包,STM32CubeMX插件就是利用这个固件包来生成初始化代码的,大家肯定好奇这个固件包里有什么?是做什么用的?和HAL库有什么关系?本章节我们就来分析这个固件包。

本章将分为如下几个小节:

6.1、获取STM32Cube固件包;

6.2、STM32CubeMP1固件包目录结构;

6.3、CMSIS文件夹关键文件介绍;

6.4章节小结;


6.1 获取STM32Cube固件包

STM32Cube是ST公司提供的一套免费的开发工具和STM32Cube 固件包覆盖了整个STM32产品,可在STM32平台上进行快速轻松的开发,从而简化了开发人员的工作。STM32Cube由以下组件组成,这些组件可以一起使用或独立使用:

  • 允许用户通过图形化向导来生成C语言工程的图形配置工具STM32CubeMX
  • 适用于每个STM32 MCU和MPU系列的STM32Cube MCU和MPU软件包(也叫STM32Cube 固件包或者STM32Cube包)。

在前面STM32CubeIDE第一个工程实验的创建工程环节,STM32CubeIDE已经自动在C:\Users\自己的用户名称\STM32Cube\Repository\STM32Cube_FW_MP1_V1.2.0路径中下载好了STM32Cube_FW_MP1_V1.2.0包,这个包就是STM32MP1的固件包,此固件包也可以从ST官网上下载,目前最新版本是1.2.0版本。

进入ST官网https://www.st.com/content/st_com/en.html以后,在搜索框中输入STM32CubeMP1进行搜索。

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_#define


图6.1. 1搜索STM32CubeMP1固件包

开发板光盘A-基础资料\7、STM32MP1参考资料\STM32MP157 Cube包中我们也有提供STM32MP1的固件包:

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_链接脚本_02


图6.1. 2A盘中下载好的固件包

我们打开Drivers文件夹,看到的STM32MP1xx_HAL_Driver就是HAL库。

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_#define_03


图6.1. 3 HAL库

6.2 STM32CubeMP1固件包目录结构

接下来,我们看看前面下载好的STM32CubeMP1固件包目录结构,打开STM32Cube_FW_MP1_V1.2.0固件包,目录结构如下图。

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_Linux_04


图6.1. 4固件包目录结构

_htmresc文件夹下是ST公司的LOGO图片和一些网站的资料,其实是用不到的,我们不去关注。对比较重要的文件夹,我们按照顺序进行介绍:

6.2.1 Drivers文件夹

Drivers文件夹包含BSP,CMSIS和STM32MP1xx_HAL_Driver三个子文件夹。三个子文件夹具体说明请参考下表

BSP

文件夹

BSP也叫板级支持包,此支持包提供的是直接与硬件打交道的API,例如触摸屏,LCD,SRAM以及EEPROM等板载硬件资源等驱动。目前在STM32cubeMP1固件包中,ST还未添加这部分内容(目前有LED、COM端口以及按钮相关的API),后期ST应该会逐渐添加这些文件。

BSP文件夹下还给了ST官方DISCO和EVAL开发板的硬件驱动API文件,每一种板对应一个文件夹。可以打开开发板文件夹,根据里边帮助文档查看API文件都有什么内容

CMSIS

文件夹

CMSIS文件夹用于存放符合CMSIS标准的文件,包括STM32启动文件、ARM Cortex内核文件和对应外设头文件。关于CMSIS文件夹里的文件,我们后面会专门讲解。

Core

用于Cortex-M处理器内核和外围设备的API

Core_A

用于Cortex-A5 / A7 / A9处理器内核和外围设备的API

Device

微控制器专用头文件/启动代码/专用系统文件

DSP

适用于各种数据类型的DSP库集合

Include

STM32MP1xx外围设备访问层头文件

Lib

ARM、GCC 和 IAR格式的 DSP 库文件

NN

神经网络库集合,目的是在Cortex-M处理器内核上最大化神经网络的性能并最​​小化其内存占用

RTOS

实时操作系统通用API相关文件(V1版本),兼容RTX4

RTOS2

对RTOS V1的拓展,兼容RTX5

STM32MP1xx_HAL_Driver文件夹

HAL库文件夹,处理STM32“内部”设备,它包含了所有的STM32MP1xx系列HAL库头文件和源文件,也就是所有底层硬件抽象层API声明和定义。它的作用是屏蔽了复杂的硬件寄存器操作,统一了外设的接口函数。该文件夹包含Src和Inc两个子文件夹,其中Src子文件夹存放的是.c源文件,Inc子文件夹存放的是与之对应的.h头文件。每个.c源文件对应一个.h头文件。在前面的STM32CubeIDE第一个工程实验中就有用到该文件夹的文件,我们后面会重点介绍该文件夹的文件。

表6.2.1. 1 Drivers文件夹简介

6.2.2 Middlewares文件夹

Middlewares(中间件)文件夹下目前只有Third_Party文件夹,是提供一组服务的库,目前里边只有FreeRTOS实时系统支持包和OpenAMP文件夹。

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_链接脚本_05


图6.2.2. 1文件夹

FreeRTOS是一个免费的实时操作系统(RTOS),它同时支持抢占优先级和协作优先级,具有非常弹性的任务优先级分配,可以快速响应中断,在实时性要求较高的产品开发中应用很广泛。关于FreeRTOS的学习,感兴趣的可以查看正点原子《STM32F429 FreeRTOS开发手册》 FreeRTOS文件夹下,其具有FreeRTOS实时系统支持包,Source目录包含每个端口共有的三个文件list.c,queue.c和tasks.c,内核包含在这三个文件中。Source/Portable目录包含用于于特定微控制器和/或编译器的文件。Source/include目录包含实时内核头文件。Source/CMSIS_RTOS和Source/CMSIS_RTOS_V2下是FreeRTOS实时系统API文件,一个是V1版本一个是V2版本。

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_链接脚本_06


图6.2.2. 2支持包

AMP是指非对称多处理, 非对称多处理是指各核的结构并非对称,例如STM32MP1是两个Cortex-A7内核加一个Cortex-M4内核的组合各个核结构并非对称。OpenAMP常用于处理器间通信,OpenAMP软件框架为开发AMP系统提供了必要的API函数,可以实现核间通信。

6.2.3 Projects文件夹

该文件夹存放的是一些可以直接编译的实例工程,是STM32MP1xx系列的STM32CubeMP1固件示例。每个文件夹对应一个ST官方的Demo板。比如我们要查看STM32mp157相关工程,我们直接打开子文件夹STM32MP157C-DK2即可,里面有很多实例供我们参考。每个Demo板下都会有以下4个文件夹:

  • Applications: OpenAMP、FreeRTOS和CoproSync应用程序示例。
  • Demonstrations:AI相关示例。
  • Examples:外围设备的功能和用法示例。
  • Templates:固件库工程模板,允许用户在给定的板上快速构建任何固件应用程序。

我们查看其中的示例的时候,工程下面有MDK-ARM和STM32CubeIDE子文件夹,双击MDK-ARM子文件夹内部的Project.uvprojx的工程文件,可以在MDK中打开工程,双击STM32CubeIDE子文件夹下的.project工程文件,可以在STM32CubeIDE中打开工程。

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_Linux_07


图6.2.3. 1工程文件

关于Projects文件夹的整体介绍,可以打开里边的STM32CubeProjectsList.html文件了解更加详细内容。在查看工程文件的时候,可以打开里边的readme.txt查看介绍内容。

6.2.4 Utilities文件夹

该文件夹中的文件介绍了如何配置STM32MP1xx的资源管理器,例如文件中提供了共享内存中的虚拟表地址、在ETZPC控制下的设备寄存器地址表、共享资源ID等,这些文件由ST官网提供,一般不能修改文件中的内容。

6.2.5 其它文件

Readme.md简单介绍STM32CubeMP1固件文件的内容。Release_Notes.html文件是固件库版本更新说明,关于STM32CubeMP1固件版本详细更新内容,我们可以查看此文件。License.md和package.xml文件只是协议说明和固件包版本的说明,不用怎么管。

6.3 CMSIS文件夹关键文件介绍

随着32位处理器在嵌入式市场需求量逐渐增多,各家芯片公司推出新型芯片,伴随而来的是开发工具、软件兼容以及代码移植等问题。在这种情况下,各个硬件平台的供应商都寻求易于使用且高效的解决方案,其中,ARM与Atmel、IAR、KEIL、SEGGER和ST等诸多芯片和软件工具厂商合作,发布了一套CMSIS标准。

CMSIS(Cortex Microcontroller Software Interface Standard),即ARM Cortex微控制器软件接口标准。CMSIS标准提供了内核和外围设备、实时操作系统和中间组件之间的通用API接口,从而简化了软件的重复使用,缩短了微控制器开发人员的学习时间,并缩短了新设备的上市时间。下图是ARM公司的CMSIS标准结构框图:

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_#define_08


图6.3. 1CMSIS标准结构框图

其中,CMSIS-CORE层定义了Cortex-M以及Cortex-A处理器(Cortex-A5/A7/A9)内核和外围设备的标准化API。CMSIS-Pack层包含了CMSIS-Driver驱动框架、CMSIS-DSP相关库、CMSIS-RTOS操作系统API、中间件API和Peripheral HAL层API等。根据CMSIS的标准,ARM公司整合并提供了CMSIS 软件包模板,目前最新的是5.7.0版本,感兴趣的小伙伴可以在CMSIS官网浏览更多信息: https://developer.arm.com/tools-and-software/embedded/cmsis

基于ARM提供的CMSIS 软件包模板,ST官方结合自己芯片的差异进行了修改,并将其整合到了STM32Cube固件包中的CMSIS文件夹里。

打开固件包中STM32Cube_FW_MP1_V1.2.0\Drivers\CMSIS目录,其中,Device文件夹和Include文件夹是每个工程都要用到的。

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_寄存器_09


图6.3. 2 CMSIS目录

Device文件夹下是具体芯片直接相关的文件,里边是ST官方的STM32MP1xx器件专用的头文件、启动代码文件和专用系统文件,此文件夹下我们重点介绍这几个文件:stm32mp1xx.h、system_stm32mp1xx.c、startup_stm32mp15xx.s和stm32mp15xx_m4.ld文件。

Include文件夹下是符合CMSIS标准的内核头文件,主要是核内外设文件,我们会重点介绍core_cm4.h文件。

6.3.1 stm32mp1xx.h文件

文件路径:Device\ST\STM32MP1xx\Include\stm32mp1xx.h

stm32mp1xx.h文件在工程中是一定要有的,文件的内容看起来不多,却非常重要。该文件主要就是确定代码中是否使用或者不使用某个底层驱动文件,我们简单分析stm32mp1xx.h文件。抛开文件中的主体代码,如下代码是笔者将主体部分代码删掉以后所看到的整体框架,其它的头文件框架也类似:

1 #ifndef __STM32MP1xx_H​
2 #define __STM32MP1xx_H​
3 ​
4 #ifdef __cplusplus /* c++编译环境中才会定义__cplusplus (plus即"+"的意思) */​
5 extern "C" { /* 告诉编译器下面程序采用c方式编译 */​
6 #endif /* __cplusplus */​
7 ​
8 /****** 省略的代码 ******/​
9 ​
10 #ifdef __cplusplus​
11 }​
12 #endif /* __cplusplus */​
13 #endif /* __STM32MP1xx_H */​

学过C++的朋友应该很熟悉,上面第4行到第12行代码是为了在C++中尽可能的支持C代码和C库。意思是,如果这是一段C的代码,那么加入"extern "C"{" 和 " }"处理其中的代码,因为C++和C对产生的函数名字的处理是不一样的,C++中存在重载,C中没有重载,为了在C++代码中调用C写成的库文件,就需要用extern"C"来告诉编译器:这是一个用C写成的库文件,请用C的方式来链接它们。如果不这样处理,在C++中编译后会出现链接错误。这么做其实也是为了方便代码移植。

下面我们分析stm32mp1xx.h文件的主要代码实现部分。

1 #if !defined (STM32MP1)​
2 #define STM32MP1​
3 #endif /* STM32MP1 */​
4 ​
5 #if !defined (USE_HAL_DRIVER)​
6 #endif /* USE_HAL_DRIVER */​
7 ​
8 /****** 省略了CMSIS设备版本号相关代码 ******/​
9 ​
10 #if defined(CORE_CM4)​
11 /* keep for backward compatibility STM32MP15xx = STM32MP157Cxx */​
12 #if defined(STM32MP15xx) ​
13 #include "stm32mp157cxx_cm4.h"​
14 #elif defined(STM32MP157Axx)​
15 #include "stm32mp157axx_cm4.h"​
16 #elif defined(STM32MP157Cxx)​
17 #include "stm32mp157cxx_cm4.h"​
18 /****** 此处省略部分内容 ******/​
19 #elif defined(STM32MP151Fxx)​
20 #include "stm32mp151fxx_cm4.h"​
21 #else​
22 #error "Please select first the target STM32MP1xx device used in your application (in stm32mp1xx.h file)"​
23 #endif​
24 #endif​
25​

如上图代码,大部分是一些条件编译,如果条件编译的宏有被定义,那么就参加编译。我们先看第10行到24行间的代码,第10行到13行,如果定义了CORE_CM4这个宏,当再定义STM32MP15xx这个宏的时候,就会包含stm32mp157cxx_cm4.h头文件,同理第14行到20行也是类似的宏定义,只要有定义某个宏,就会包含对应的头文件。

第37和38行,在定义宏CORE_CM4以后,没有定义其它宏,那么就会提示:Please select first the target STM32MP1xx device used in your application (in stm32mp1xx.h file),提示要在stm32mp1xx.h文件中定义这个宏。

包含的stm32mp157cxx_cm4.h这些头文件也在Device\ST\STM32MP1xx\Include\目录下,里边有很多stm32mp151Pxx_cm4.h、stm32mp153Pxx_cm4.h和stm32mp157Pxx_cm4.h文件(这里的P是一个代号,表示a、c、d和f)。这些文件是干嘛用的呢?我们打开其中一个文件大概看看,例如stm32mp157dxx_cm4.h这个文件,文件中的内容很多,有上万行的代码,根据里边的注释,了解到这个文件主要就是对STM32MP1XX系列器件的Cortex-M处理器和核心外设的配置,例如中断号定义、外设寄存器结构体声明、外设寄存器位定义和寄存器的操作的宏定义以及外围设备内存映射等等。

我们接着往下看后面的代码。

1 #if defined(CORE_CA7)​
2 /* keep for backward compatibility STM32MP15xx = STM32MP157Cxx */​
3 #if defined(STM32MP15xx) ​
4 #include "stm32mp157cxx_ca7.h"​
5 #elif defined(STM32MP157Axx)​
6 #include "stm32mp157axx_ca7.h"​
7 #elif defined(STM32MP157Cxx)​
8 #include "stm32mp157cxx_ca7.h"​
9 /****** 此处省略部分内容 ******/​
10 #elif defined(STM32MP151Fxx)​
11 #include "stm32mp151fxx_ca7.h"​
12 #else​
13 #error "Please select first the target STM32MP1xx device used in your application (in stm32mp1xx.h file)"​
14 #endif​
15 #endif​

第1行先定义一个宏CORE_CA7,在这个宏的基础上,如果有定义其它的宏就会包含对应的头文件,如果没有定义宏将提示Please select first the target STM32MP1xx device used in your application (in stm32mp1xx.h file)。这些包含的头文件,例如stm32mp157cxx_ca7.h文件和前面的stm32mp157cxx_cm4.h头文件作用类似,只不过stm32mp157cxx_ca7.h文件是针对Cortex-A内核的。

经过前面的分析,正点原子的开发板使用的是STM32MP157DAA1这颗芯片,根据前面的分析应该是要包含stm32mp157dxx_cm4.h和stm32mp157dxx_ca7.h文件,则需要定义宏STM32MP157Dxx。

我们查看最后的代码:

1 typedef enum     /* 布尔形变量定义 */​
2 {​
3 RESET = 0,​
4 SET = !RESET​
5 } FlagStatus, ITStatus;​
6 ​
7 typedef enum /* 功能型状态变量 */​
8 {​
9 DISABLE = 0,​
10 ENABLE = !DISABLE​
11 } FunctionalState;​
12 #define IS_FUNCTIONAL_STATE(STATE) (((STATE) == DISABLE) || ((STATE) == ENABLE))​
13​
14 typedef enum /* 错误型状态变量 */​
15 {​
16 ERROR = 0,​
17 SUCCESS = !ERROR​
18 } ErrorStatus;​
19 ​
20 /******一些位操作定义******/​
21 #define SET_BIT(REG, BIT) ((REG) |= (BIT))​
22​
23 #define CLEAR_BIT(REG, BIT) ((REG) &= ~(BIT))​
24​
25 #define READ_BIT(REG, BIT) ((REG) & (BIT))​
26​
27 #define CLEAR_REG(REG) ((REG) = (0x0))​
28​
29 #define WRITE_REG(REG, VAL) ((REG) = (VAL))​
30​
31 #define READ_REG(REG) ((REG))​
32​
33 #define MODIFY_REG(REG, CLEARMASK, SETMASK) WRITE_REG((REG), \ (((READ_REG(REG)) & (~(CLEARMASK))) | (SETMASK)))​
34​
35 #define POSITION_VAL(VAL) (__CLZ(__RBIT(VAL)))​
36​
37 #if defined (USE_HAL_DRIVER)​
38 #include "stm32mp1xx_hal_conf.h"​
39 #endif /* USE_HAL_DRIVER */​

第1行到第18行是一些通过枚举类型定义变量,例如FlagStatus有RESET和SET两个状态,分别为0和1,ITStatus也是有两个状态0和1。这些枚举类型变量会大量地用于HAL库的文件中只要遇见这些变量,我们想到的是它的值要么是0要么是1。

第12行是用于参数检查的,如果输入的参数是DISABLE和ENABLE其中的一个,那么(((STATE) == DISABLE) || ((STATE) == ENABLE))的值始终为1,否则为0。

第21到35行表示一些位操作定义,例如21行#define SET_BIT(REG, BIT) ((REG) |= (BIT))中有两个参数REG和BIT,REG是一个寄存器,BIT表示这个寄存器的第几位,这个宏表示将寄存器REG的第BIT位置1。这些位定义也大量用于HAL库的文件中。

第37、38行表示如果定义了USE_HAL_DRIVER这个宏,就包含stm32mp1xx_hal_conf.h头文件,此头文件是HAL库的头文件集,一旦使用了相应的模块,就要定义相关的模块使能,然后相应模块的头文件才会被包含。

stm32mp1xx.h文件内容就这么多,经过前面的分析,如果要操作CM4的外设,我们需要定义CORE_CM4、STM32MP157Dxx和USE_HAL_DRIVER这3个宏定义,这3个宏定义在哪里定义呢?如果是用MDK来编译,点击Keil的魔术棒

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_#define_10

,在C/C++配置栏的Preprocessor Symbols(预处理器符号)的Dfine(定义)处加上CORE_CM4,USE_HAL_DRIVER,STM32MP157Dxx就可以了(注意,用英文格式的逗号隔开)。

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_寄存器_11


图6.3.1. 1上添加宏

如果是用STM32CubeIDE来编译,我们不需再进行配置,STM32CubeIDE已经自动为我们配置好了,不过我们还是需要知道在哪里配置。打开STM32CubeIDE第一个工程的工程文件,选中HAL_LED_CM4(in CM4)工程,右键选择Properties,打开CM4工程属性以后,找到Paths and Symbols下的Symbols选项,里边的就是符号定义。

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_寄存器_12


图6.3.1. 2CubeIDE上添加宏

也可以在C/C++ BuildàSettingsàTool SettingsàMCU GCC CompileràPreprocessor中看到添加了哪些宏定义。

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_MP157_13


图6.3.1. 3查看添加了那些宏

6.3.2 stm32mp157dxx_cm4.h

文件路径:Device\ST\STM32MP1xx\Include\stm32mp157dxx_cm4.h

在stm32mp1xx.h文件中有介绍到,通过同时定义CORE_CM4和STM32MP157Dxx宏来加载stm32mp157dxx_cm4.h文件。前面我们也有介绍到stm32mp157dxx_cm4.h文件,打开文件进行浏览,文件中的内容很多,有上万行的代码,根据里边的注释,了解到这个文件主要就是对STM32MP157dxx系列器件的Cortex-M处理器和外设(GPIO、DMA、TTFD、ETH、CRC、TIM、UART、I2C等等)的设备资源定义,例如外设中断号定义、外设寄存器结构体声明、外设寄存器位定义和寄存器的操作的宏定义以及外围设备内存映射等等。

里边使用了大量的结构体来对寄存器进行封装,如果我们要访问某个寄存器,只需要定义一个结构体指针,然后通过指针来读写对应的寄存器(结构体成员)。下面我们以GPIO为例子介绍:

typedef struct​
{​
__IO uint32_t MODER; /* GPIO端口模式寄存器,地址偏移量:0x000 */​
__IO uint32_t OTYPER; /* GPIO端口输出类型寄存器,地址偏移量:0x004 */​
__IO uint32_t OSPEEDR; /* GPIO端口输出速度寄存器,地址偏移量:0x008 */​
__IO uint32_t PUPDR; /* GPIO端口上拉/下拉寄存器,地址偏移量:0x00C */​
__IO uint32_t IDR; /* GPIO端口输入数据寄存器,地址偏移量:0x010 */​
__IO uint32_t ODR; /* GPIO端口输出数据寄存器,地址偏移量:0x014 */​
__IO uint32_t BSRR; /* GPIO端口位设置/重置寄存器,地址偏移量:0x018*/ ​
__IO uint32_t LCKR; /*GPIO端口配置锁定寄存器,地址偏移量:0x01C*/ ​
__IO uint32_t AFR[2]; /* GPIO备用功能寄存器,地址偏移量:0x020-0x024*/ ​
__IO uint32_t BRR; /* GPIO端口位复位寄存器,地址偏移量:0x028 */ ​
uint32_t RESERVED0; /* 保留,地址偏移量:0x02C */ ​
__IO uint32_t SECCFGR; /*用于GPIOZ的GPIO安全配置寄存器,地址偏移量:0x030*/ ​
uint32_t RESERVED1[229]; /* 保留,地址偏移量:0x034-0x3C4*/​
__IO uint32_t HWCFGR10; /* GPIO硬件配置寄存器10,地址偏移量:0x3C8*/ ​
__IO uint32_t HWCFGR9; /* GPIO硬件配置寄存器9,地址偏移量:0x3CC*/ ​
__IO uint32_t HWCFGR8; /* GPIO硬件配置寄存器8,地址偏移量:0x3D0*/ ​
__IO uint32_t HWCFGR7; /* GPIO硬件配置寄存器7,地址偏移量:0x3D4*/ ​
__IO uint32_t HWCFGR6; /* GPIO硬件配置寄存器6,地址偏移量:0x3D8*/ ​
__IO uint32_t HWCFGR5; /* GPIO硬件配置寄存器5,地址偏移量:0x3DC*/ ​
__IO uint32_t HWCFGR4; /*GPIO硬件配置寄存器4,地址偏移:0x3E0*/ ​
__IO uint32_t HWCFGR3; /* GPIO硬件配置寄存器3,地址偏移量:0x3E4*/ ​
__IO uint32_t HWCFGR2; /* GPIO硬件配置寄存器2,地址偏移量:0x3E8*/ ​
__IO uint32_t HWCFGR1; /* GPIO硬件配置寄存器1,地址偏移量:0x3EC*/ ​
__IO uint32_t HWCFGR0; /*GPIO硬件配置寄存器0,地址偏移量:0x3F0*/ ​
__IO uint32_t VERR; /*GPIO版本寄存器,地址偏移量:0x3F4*/ ​
__IO uint32_t IPIDR; /* GPIO识别寄存器,地址偏移量:0x3F8 */​
__IO uint32_t SIDR; /* GPIO大小识别寄存器,地址偏移量:0x3FC */​
} GPIO_TypeDef;​

这段代码中,typedef是类型定义以及结构体定义的基本语法我们在前面5.1.5小节和5.1.6小节有讲解。__IO表示volatile ,在core_cm4.h文件中有定义其中结构体成员MODER、OTYPER、和SIDR这些是GPIOx(x等于A~K和Z)对应的寄存器名称

这里,每个结构体成员均定义为uint32_t即相邻每个成员偏移4个字节,寄存器MODER偏移地址为0x000寄存器OTYPER偏移地址为0x004以此类推

通过结构体,我们知道了偏移地址,要确定一个寄存器的实际地址,我们还需要知道基地址。通过参考手册我们知道GPIOI挂在了AHB总线上,且AHB总线的基地址是0x50000000

GPIOI的基地址就是0x5000A000这个基地址在代码的哪里定义了呢


《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_寄存器_14


图6.3.2. 1参考手册部分截图

也是在stm32mp157dxx_cm4.h头文件中可以找到如下的代码:

1外围内存映射 */​
2 #define MCU_AHB_SRAM ((uint32_t)0x10000000) ​
3 #define MCU_AHB_RETRAM ((uint32_t)0x00000000) ​
4 ​
5 #define SYSRAM_BASE ((uint32_t)0x2FFC0000) ​
6 #define RETRAM_BASE MCU_AHB_RETRAM​
7 #define SRAM_BASE MCU_AHB_SRAM​
8 #define PERIPH_BASE ((uint32_t)0x40000000) ​
9 #define MPU_AXI_BUS_MEMORY_BASE ((uint32_t)0x60000000) ​
10​
11 #define FMC_NOR_MEM_BASE (MPU_AXI_BUS_MEMORY_BASE) ​
12 #define QSPI_MEM_BASE (MPU_AXI_BUS_MEMORY_BASE + 0x10000000) ​
13 #define FMC_NAND_MEM_BASE (MPU_AXI_BUS_MEMORY_BASE + 0x20000000) ​
14 #define STM_DATA_BASE (MPU_AXI_BUS_MEMORY_BASE + 0x30000000) ​
15 #define DRAM_MEM_BASE (MPU_AXI_BUS_MEMORY_BASE + 0x60000000) ​
16​
17 /*设备电子签名内存映射 */​
18 #define UID_BASE (0x5C005234L) ​
19 #define PACKAGE_BASE (0x5C005240L) ​
20 #define RPN_BASE (0x5C005204L) ​
21 #define DV_BASE (0x50081000L) ​
22​
23 /* 外围内存映射 */​
24 #define MCU_APB1_PERIPH_BASE (PERIPH_BASE + 0x00000000)​
25 #define MCU_APB2_PERIPH_BASE (PERIPH_BASE + 0x04000000)​
26 #define MCU_AHB2_PERIPH_BASE (PERIPH_BASE + 0x08000000)​
27 #define MCU_AHB3_PERIPH_BASE (PERIPH_BASE + 0x0C000000)​
28 #define MCU_AHB4_PERIPH_BASE (PERIPH_BASE + 0x10000000)​
29 #define MCU_APB3_PERIPH_BASE (PERIPH_BASE + 0x10020000)​
30 #define APB_DEBUG_PERIPH_BASE (PERIPH_BASE + 0x10080000)​
31 #define MPU_AHB5_PERIPH_BASE (PERIPH_BASE + 0x14000000)​
32 #define GPV_PERIPH_BASE (PERIPH_BASE + 0x17000000)​
33 #define MPU_AHB6_PERIPH_BASE (PERIPH_BASE + 0x18000000)​
34 #define MPU_APB4_PERIPH_BASE (PERIPH_BASE + 0x1A000000)​
35 #define MPU_APB5_PERIPH_BASE (PERIPH_BASE + 0x1C000000)​
36 /******省略APB1、APB2、AHB2、AHB3相关代码******/​
37 /*!< MCU_AHB4 */​
38 #define RCC_BASE (MCU_AHB4_PERIPH_BASE + 0x0000)​
39 #define PWR_BASE (MCU_AHB4_PERIPH_BASE + 0x1000)​
40 #define GPIOA_BASE (MCU_AHB4_PERIPH_BASE + 0x2000)​
41 #define GPIOB_BASE (MCU_AHB4_PERIPH_BASE + 0x3000)​
42 #define GPIOC_BASE (MCU_AHB4_PERIPH_BASE + 0x4000)​
43 #define GPIOD_BASE (MCU_AHB4_PERIPH_BASE + 0x5000)​
44 #define GPIOE_BASE (MCU_AHB4_PERIPH_BASE + 0x6000)​
45 #define GPIOF_BASE (MCU_AHB4_PERIPH_BASE + 0x7000)​
46 #define GPIOG_BASE (MCU_AHB4_PERIPH_BASE + 0x8000)​
47 #define GPIOH_BASE (MCU_AHB4_PERIPH_BASE + 0x9000)​
48 #define GPIOI_BASE (MCU_AHB4_PERIPH_BASE + 0xA000)​
49 #define GPIOJ_BASE (MCU_AHB4_PERIPH_BASE + 0xB000)​
50 #define GPIOK_BASE (MCU_AHB4_PERIPH_BASE + 0xC000)​
51 #define AIEC_BASE (MCU_AHB4_PERIPH_BASE + 0xD000)​
52 #define AIEC_C1_BASE (AIEC_BASE + 0x0080)​
53 #define AIEC_C2_BASE (AIEC_BASE + 0x00C0)​
54 /* Alias EXTI_BASE defined because HAL code not yet reworked with new name AIEC*/​
55 #define EXTI_BASE AIEC_BASE​
56 #define EXTI_C1_BASE AIEC_C1_BASE​
57 #define EXTI_C2_BASE AIEC_C2_BASE​

这部分代码是内存映射相关的宏定义。如上代码,第8行定义PERIPH_BASE宏为0x4000000028行宏MCU_AHB4_PERIPH_BASE为(PERIPH_BASE + 0x10000000)计算得出0x5000 0000,此值刚好表示AHB4总线的基地址。第48行宏GPIOI_BASE(MCU_AHB4_PERIPH_BASE + 0xA000)计算得出0x5000 A000此值刚好是GPIOI的基地址。同样的,其它的总线以及外设的基地址在stm32mp157dxx_cm4.h头文件中均有定义

总线或者外设的偏移地址找到了,基地址也找到了,基地址+偏移地址就等于实际地址。如果我们要操作某个外设,也就是操作对应外设的寄存器,那么,这些寄存器的地址又怎么得来的呢?在stm32mp157dxx_cm4.h头文件中找到如下部分代码

#define GPIOI ((GPIO_TypeDef *) GPIOI_BASE)​

这里表示将宏GPIOI定义为((GPIO_TypeDef *) GPIOI_BASE)

GPIOI_BASE 是一个uint32_t类型我们已经计算得出0x5000 A000GPIO_TypeDef结构体我们在前面有列出代码(GPIO_TypeDef *)里边加了一个*号,表示结构体指针类型。((GPIO_TypeDef *) GPIOI_BASE)表示将uint32_t类型的GPIOI_BASE强制转化成结构体指针类型

上面这一行代码就表示:将GPIOI变成GPIO_typedef 类型的结构体指针,并且默认指向了基地址GPIOI_BASE,即从GPIOI_BASE开始,长度为RCC_TypeDef这个类型的长度。这样一来,每个寄存器的地址也就确定下来了,通过指针即可访问结构体的成员(寄存器)。

在以后,我们要操作GPIOI中的某个寄存器,例如操作ODR寄存器,只需要通过指针操作结构体成员就可以了:

GPIOI->ODR = 0XFFFF;​

上面,GPIOI->ODR也可以改写为(*GPIOI).ODR。这段代码表示将GPIOI中的ODR寄存器赋值为0XFFFF

实际上,在HAL库中很多函数里就是这么用的,例如在HAL库的stm32mp1xx_hal_gpio.c文件中就有很多这样的代码

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_Linux_15


图6.3.2. 2库函数部分截图

6.3.3 stm32mp157dxx_ca7.h文件

文件路径:Device\ST\STM32MP1xx\Include\stm32mp157dxx_ca7.h

和stm32mp157dxx_cm4.h文件类似,只不过是对Cortex-A7处理器和核心外设的配置。

6.3.4 system_stm32mp1xx.c文件

文件路径:

Device\ST\STM32MP1xx\Include\system_stm32mp1xx.h

Device\ST\STM32MP1xx\Source\Templates\system_stm32mp1xx.c

这两个文件提供了两个函数和一个全局变量:系统初始化函数SystemInit、系统时钟更新函数SystemCoreClockUpdate和SystemCoreClock全局变量。

SystemInit函数在系统复位后,在跳到主程序main.c之前被startup_stm32mp1xx.s文件调用。SystemInit函数中主要是初始化FPU设置、配置SRAM中的向量表和禁用所有中断和事件。我们简单分析一下代码。

1 void SystemInit (void)​
2 {​
3 /* FPU settings */​
4 #if defined (CORE_CM4)​
5 #if (__FPU_PRESENT == 1) && (__FPU_USED == 1)​
6 /* set CP10 and CP11 Full Access */​
7 SCB->CPACR |= ((3UL << 10*2)|(3UL << 11*2)); ​
8 #endif​
9 ​
10 /*配置中断向量表地址=基地址+偏移地址 */​
11 #if defined (VECT_TAB_SRAM) /* 向量表存储在 SRAM */​
12 /* Vector Table Relocation in Internal SRAM */​
13 SCB->VTOR = MCU_AHB_SRAM | VECT_TAB_OFFSET; ​
14 #endif​
15 /* Disable all interrupts and events */​
16 CLEAR_REG(EXTI_C2->IMR1);​
17 CLEAR_REG(EXTI_C2->IMR2);​
18 CLEAR_REG(EXTI_C2->IMR3);​
19 CLEAR_REG(EXTI_C2->EMR1);​
20 CLEAR_REG(EXTI_C2->EMR2);​
21 CLEAR_REG(EXTI_C2->EMR3);​
22 #else​
23 #error Please #define CORE_CM4​
24 #endif ​
25 }​

FPU(Floating Point Unit,浮点单元)即用于处理浮点数运算的单元,可以大大加速浮点运算的处理速度。STM32MP1系列器件的Cortex-M4 内核是具有FPU单元的,支持浮点指令集,处理数学运算能力得以大大提高。

第4到第8行表示使用条件编译来设置FPU,如果定义了CORE_CM4宏,当__FPU_PRESENT和__FPU_USED同时为1时,就使能FPU单元,编译时就加入启动FPU 的代码,CPU 也就能正确高效的使用FPU 进行简单的加减乘除运算了。第12行表示设置 CPACR 寄存器的 20~23 位为 1,以开启STM32MP1的硬件 FPU 功能。

根据前面的分析,如果我们要开启FPU,只需要定义CORE_CM4宏,并将__FPU_PRESENT和__FPU_USED同时设置为1就可以了,在前面我们已经知道定义CORE_CM4宏了,剩下的__FPU_PRESENT和__FPU_USED将怎么设置呢?

如果使用的是MDK的朋友,使用的是keil5的话,只需要在点击魔术棒

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_Linux_16

,然后再Floating Point Hardware里选择Use Single Presicion就可以了。

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_Linux_17


图6.3.4. 1中开启FPU

如果使用的是STM32CubeIED的话,可以打开STM32CubeIDE第一个工程的工程文件,选中HAL_LED_CM4(in CM4)工程,右键选择Properties,打开CM4工程属性,找到C/C++ Buildà SettingsàTool SettingsàMCU Settings,可以看到系统已经自动为我们设置好了支持FPU了。Floating-point ABI选择的是硬件浮点单元,浮点运算处理方式为FPv4-SP-D16,其中d16表示有16个64位的单精度寄存器,指令集选的是Thumb2。最后我们看到Use float with printf from newlib-nano(-u _printf_float) 和Use float with printf from newlib-nano(-u_scanf_float)选项,这两个选项通常是用于串口打印的时候设置的,在串口实验中设置这两项以后,串口支持浮点类型数据打印。

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_#define_18


图6.3.4. 2中设置FPU

第11到第14行,这段代码表示表示如果定义VECT_TAB_SRAM,则内部SRAM中的向量表被重定位。MCU_AHB_SRAM表示向量表基地址,其值为0x10000000(在stm32mp157dxx_cm4.h文件中定义),VECT_TAB_OFFSET表示向量表偏移量,可以修改它的值,修改的时候,其值必须是0x400的倍数。VTOR 寄 存 器 存 放 的 是 中 断 向 量 表 的 起 始 地 址(其有一个默认值),默 认 情 况,VECT_TAB_SRAM 是没有定义的。在system_stm32mp1xx.c文件的最前面有#define VECT_TAB_OFFSET 0x00这句,已经定义了向量表偏移量为0x00,如果将0x00修改0x10,同时也定义VECT_TAB_SRAM这个宏,那么:

SCB->VTOR=0x10000000|0x10=0x10000010​

这样就设置了中断向量表偏移。不过一般尽量不要修改system_stm32mp1xx.c这样的系统级别文件,如果要改的话,尽量在其他文件中进行修改。

第16到第21行,表示清除中断屏蔽寄存器EXTI_IMR1、EXTI_IMR2和EXTI_IMR3以屏蔽中断请求,即禁用所有中断和事件。

接下来我们查看SystemCoreClockUpdate函数。SystemCoreClockUpdate函数的代码比较多,注释也比较详细,为了不占用篇幅,我们这里省略部分代码:

1 uint32_t SystemCoreClock = HSI_VALUE;​
2 ​
3 void SystemCoreClockUpdate (void)​
4 {​
5 uint32_t pllsource, pll3m, pll3fracen;​
6 float fracn1, pll3vco;​
7 ​
8 switch (RCC->MSSCKSELR & RCC_MSSCKSELR_MCUSSRC)​
9 {​
10 case 0x00: /* HSI used as system clock source */​
11 SystemCoreClock = (HSI_VALUE >> (RCC->HSICFGR & \ RCC_HSICFGR_HSIDIV));​
12 break;​
13​
14 case 0x01: /* HSE used as system clock source */​
15 SystemCoreClock = HSE_VALUE;​
16 break;​
17​
18 case 0x02: /* CSI used as system clock source */​
19 SystemCoreClock = CSI_VALUE;​
20 break;​
21​
22 case 0x03: /* PLL3_P used as system clock source */​
23 /*******省略部分代码*******/​
24 break;​
25 }​
26​
27 /* Compute mcu_ck */​
28 SystemCoreClock = SystemCoreClock >> (RCC->MCUDIVR & \ RCC_MCUDIVR_MCUDIV);​
29 }​

根据注释,System Clock 的时钟源有:HSI(默认值64 MHz)、HSE(默认值为24 MHz)、CSI(默认值为4 MHz)和PLL3_P。在文件前面有一行uint32_t SystemCoreClock = HSI_VALUE,其中HSI_VALUE的值为64000000(在stm32mp1xx_hal_conf.h文件中定义)。根据代码的注释,SystemCoreClock是一个全局变量,系统复位以后,系统时钟默认采用HSI_VALUE,即为64MHz。在本篇的CM4裸机实验中,如果我们没有配置时钟树,那么MCU内核时钟就默认64Hz的时钟(在前面STM32CubeIDE第一个工程章节有介绍)。

SystemCoreClockUpdate函数的作用就是,根据时钟寄存器的值来更新SystemCoreClock变量。SystemCoreClock变量包含核心时钟频率(HCLK),用户应用程序可以使用它来设置SysTick定时器或配置其他参数。在程序执行期间,每次内核时钟改变时,都必须调用SystemCoreClockUpdate函数来更新SystemCoreClock变量值,如果不这样,SystemCoreClock变量值将会不准确,任何基于SystemCoreClock变量的配置都是不正确的。这么做也就是为了保证SystemCoreClock的准确性。 时钟部分在STM32中比较复杂,也不是三言两语能说的清楚,我们后面会分出专门的章节来讲解,并结合对应的实验来加深理解。

6.3.5 startup_stm32mp15xx.s文件

1. 启动文件在哪

文件路径:Device\ST\STM32MP1xx\Source\Templates\gcc\startup_stm32mp15xx.s

startup_stm32mp15xx.s是由ST官方提供的,一般直接拿来用,有需要的时候才会改写。它主要是用汇编语言编写,是系统上电后第一个运行的程序文件,属于启动文件。Device\ST\STM32MP1xx\Source\Templates下面有3个文件夹,每个文件夹下均有一个startup_stm32mp15xx.s文件,不同的开发环境使用不同文件夹下的startup_stm32mp15xx.s文件,STM32CubeIDE软件使用的是gcc下的文件,MDK软件使用的是arm下的文件,每个文件夹下的文件内容均不相同,但是他们的功能是一样的。

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_#define_19


图6.3.5. 1 Templates文件夹

2. 启动文件中的部分指令

在分析启动文件前,我们先来了解几个汇编语法:

指令名称

作用

.global

用法:.global symbol

.global关键字用来让一个符号全局可见,以上用法,声明symbol是全局可见

.word

用法:.word undefined_instruction

undefined_instruction是一个标号.word表示在这个地方定义一个16bit的数据变量

.section

用法:.section section_name[,"flags"[,%type[,flag_specific_arguments]]]

.section表示自定义一个内存段每一个段以段名为开始,以下一个段名或者文件结尾为结束

.weak

用法:.weaksymbol

weak表示弱定义,即弱定义一个符号。.weak 声明的符号与其它地方声明的同名符号,其它地方的符号优先被引用。

ldr

从存储器中加载字到一个存储器中

movs

movs是字符串传送指令,movsb传送字符, movsw传送字,movsd传送双字

bx

跳转到由寄存器/标号给出的地址,不用返回

b

跳转到一个标号

blx

跳转到由寄存器给出的地址,并根据寄存器的 lse 确定处理器的状态,还要把跳转前的下条指令地址保存到 lr

adds

adds加法指令, 带进位,影响进位标志位C而不影响运算结果的值

cmp

比较指令,进行比较两个操作数的大小

bcc

bcc是跳转指令,当CPSR寄存器条件标志位为0时跳转

str

用法:str{条件} 源寄存器,<存储器地址>

源寄存器中将一个数据传送到存储器中

.size

返回配送给变量的字节数

.thumb_set

作用类似于.set, 可以用来给一个标志起一个别名

.type

用来指定一个符号的类型是函数类型或者是对象类型

表6.3.5. 1部分汇编指令

3. 启动文件分析

上表列举了STM32启动文件的一些汇编和编译器指令,关于其他更多的ARM汇编指令,大家可以查阅汇编语法的书籍。下面,我们借助文件中的注释,我们来分析一下startup_stm32mp15xx.s文件做了些什么工作。

1)设置栈指针SP;

2)设置初始PC= Reset_Handler;

2)设置中断向量表入口地址,并初始化向量表;

3)初始化.data 和 .bss 段;

4)跳转到C库中的main(最终调用main函数)。

在线程模式下复位了Cortex-M处理器后,优先级为Privileged(特权模式),栈顶设置为主函数。

我们将启动文件startup_stm32mp15xx.s的代码分成几个小段,简单分析一下代码实现的功能,代码中已经附上详细的注释,大家可以根据注释大概了解启动文件的整个工作过程。

1 .syntax unified  /* 指令使用统一的语法 ,提示下面是ARM+THUMB */​
2 .cpu cortex-m4 /* 指定处理器为Cortex-M4 */​
3 .fpu softvfp /* 使用软浮点 */​
4 .thumb /* 指定汇编代码为Thumb指令集 */​
5 ​
6 /* 使用.global定义全局符号g_pfnVectors 和Default_Handler */​
7 .global g_pfnVectors /* g_pfnVectors其实是文件末尾定义的中断向量 */​
8 .global Default_Handler /* Default_Handler是死循环,用来处理异常情况 */​
9 ​
10 /* ​
11这里给出data段与bss段起始与结束地址,data段用来存​
12 储已经初始化的全局变量,bss段用来存储未初始化的全局​
13 */​
14 .word _sidata /* 初始化.data 块的起始地址,此地址在链接脚本中被定义 */​
15 .word _sdata /* .data块的起始地址,此地址在链接脚本中被定义 */ ​
16 .word _edata /* .data块的结束地址,此地址在链接脚本中被定义 */ ​
17 .word _sbss /* .bss块的起始地址,此地址在链接脚本中被定义 */​
18 .word _ebss /* .bss块的结束地址,此地址在链接脚本中被定义 */​
19 ​
20 /* 定义了一个代码段,该段可分配(a),可执行(x) */​
21 .section .startup_copro_fw.Reset_Handler,"ax" ​
22 .weak Reset_Handler /* 弱定义一个符号,名字为Reset_Handler */​
23 /* 声明Reset_Handler是一个函数类型*/​
24 .type Reset_Handler, %function ​
25 Reset_Handler: /* 标记 Reset_Handler符号位置 */​
26 ldr sp, =_estack /* 设置栈指针 */​

第1行,.syntax命令是ARM架构独有的命令,指定按照怎样的语法规则进行汇编,.syntax unified表示下面的指令是ARM和THUMB通用格式。

第2行指定处理器为Cortex-M4。

第7和第8行定义两个全局符号,g_pfnVectors和Default_Handler。

第14到18行,给出data段与bss段起始与结束地址。data段用来存储已经初始化的全局变量,bss段用来存储未初始化的全局变量。

第25行,表示标志Reset Handler符号的位置,Reset_Handler(复位中断函数)就是复位之后首先执行的那段代码。接下来我们查看Reset_Handler都做了些什么。

1 /*  ​
2 * 循环将数据从只读存储器复制到RAM。范围由以下在​
3 * 链接描述文件中评估的符号指定。​
4 * _sidata:代码段的结尾,即要复制的数据段的开头。​
5 * _sdata / _edata:应将数据复制到的RAM地址范围。​
6 * 两者都必须对齐4个字节的边界。​
7 */​
8 movs r1, #0 /* 将立即数0赋值给r1寄存器 */​
9 b LoopCopyDataInit /* 程序转移到LoopCopyDataInit处 */​
10 /* 下面一段初始化在用户程序中指定初始值的全局变量 */​
11 CopyDataInit: ​
12 ldr r3, =_sidata /*使用ldr伪指令将初始数据地址加载到r3中 */​
13 /* 从地址r3+r1处读取一个字(32bit)到r3中,r3为基地址,r1为偏移地址 */​
14 ldr r3, [r3, r1] ​
15 str r3, [r0, r1] /* 把寄存器r3的值存储到存储器中地址为r0+r1地址处 */​
16 adds r1, r1, #4 /*将r1地址中的内容写入r1,然后令r1 + 4 */​
17 ​
18 LoopCopyDataInit: /* 循环拷贝数据 */​
19 ldr r0, =_sdata /*使用ldr伪指令,在r0中写入.data的起始地址 */​
20 ldr r3, =_edata /*在r3中写入.data的末尾地址 */​
21 adds r2, r0, r1 /* r2=r0+r1 */​
22 cmp r2, r3 /* 计算r2 - r3,若小于0,标志位为0,反之为1 */​
23 /* 如果标志位为0(无借位)即r2<r3,则跳转到CopyDataInit处 */​
24 bcc CopyDataInit ​
25 ldr r2, =_sbss /* r2中存储.bss数据区的首地址 */​
26 b LoopFillZerobss /* 无条件跳转到LoopFillZerobss */​
27 ​
28 FillZerobss:​
29 movs r3, #0 /*将立即数0存入寄存器r3 */​
30 /* 将寄存器r3的值存储到地址为r2寄存器值得地址处后,r2 = r2 + 4 */​
31 str r3, [r2], #4 /* 将r3中的值写入r2,,然后r2自加4 */​
32 ​
33 LoopFillZerobss:​
34 ldr r3, = _ebss /* 将bss数据区的末尾地址写入r3 */​
35 cmp r2, r3 /* 比较r2,r3,然后更新标志位 */​
36 bcc FillZerobss /* 如果标志位为0(无借位),则跳转到FillZerobss处 */ ​
37 ​
38 /* 调用时钟系统初始化函数 */​
39 bl SystemInit /* 跳转到SystemInit函数起始处 */​
40 // ldr r0, =SystemInit​
41 // blx r0​
42 /* 调用静态构造函数 */​
43 bl __libc_init_array​
44 // ldr r0, =__libc_init_array​
45 // blx r0​
46 /* 调用应用程序的入口点 */​
47 bl main /* 转跳main函数执行 */​
48 //ldr r0, =main​
49 //blx r0​
50 ​
51 LoopForever:​
52 b LoopForever​
53 ​
54 /* 计算.Reset_Handler段的长度,同时表示.Reset_Handler段结束 */​
55 .size Reset_Handler, .-Reset_Handler​

以上就是Reset_Handler所做的工作,包括data段与bss段初始化过程。

第39行,转移到SystemInit函数起始处,SystemInit函数是在system_stm32mp1xx.c文件中定义的,它在主程序main.c执行之前被startup_stm32mp1xx.s文件调用,主要作用就是初始化FPU设置、配置SRAM中的向量表和禁用所有中断和事件,我们在前面已经有介绍。

第47行,在调用SystemInit函数以后,跳转到main函数中。

到这里终于明白了,原来,Reset_Handler所做的工作就是:先跳到SystemInit函数起始处,执行完SystemInit函数以后再跳转到main函数处,这么说,main函数并不是程序执行的第一段代码,只能说,main函数是应用程序的入口函数。

1  /* 这是当处理器收到意外中断时调用的代码。这只是​
2 * 进入一个无限循环,保留系统状态以供调试器检查​
3 */​
4 .section .text.Default_Handler,"ax",%progbits ​
5 Default_Handler: /* 默认中断向量(未重写的中断向量),进入后一直死循环 */​
6 Infinite_Loop:​
7 b Infinite_Loop /* 无条件跳转到Infinite_Loop,即无限循环​
8 .size Default_Handler, .-Default_Handler​
9 /*​
10这个部分的作用是定义了Cortex M4的最小向量​
11表,然后以字的形式分别填入了中断的指针​
12 */​
13 /* 定义了一个中断向量表的段,该段可分配(a),段内包含数据 */​
14 .section .isr_vector,"a",%progbits ​
15 /* 声明 g_pfnVectors是一个数据对象 ,同时表示段以 g_pfnVectors符号位开始 */​
16 .type g_pfnVectors, %object ​
17 /* 计算.isr_vector,同时表示.isr_vector段结束 */​
18 .size g_pfnVectors, .-g_pfnVectors ​
19​
20 /* 下面部分是STM32MP1内部指定的中断向量 */​
21 g_pfnVectors: /* 标记 g_pfnVectors符号位置 */​
22 /*​
23堆栈顶部,在当前位置放置一个word型的值,这个值为_estack;以下同理​
24 栈顶指针置于中断向量表首,Reset后读取中断向量表第一个值赋给sp指针​
25 */​
26 .word _estack /* 堆栈顶部地址,复位后首先装载堆栈 */ ​
27 .word Reset_Handler /* Reset Handler */​
28 .word NMI_Handler /* NMI Handler */​
29 ​
30 /******此处省略部分代码******/​
31 ​
32 .word SysTick_Handler /* SysTick Handler */​
33​
34 /****** 外部中断 ******/​
35 ​
36 .word WWDG1_IRQHandler /* Window WatchDog 1 */​
37 .word PVD_AVD_IRQHandler ​
38 /****** 此处省略部分代码******/​
39 .word RESERVED148_IRQHandler ​
40 .word WAKEUP_PIN_IRQHandler ​
41​
42 /*​
43 此部分的作用是给中断服务定义了一个weak(弱)别名,这个弱别名的​
44作用就是在有中断被触发后,如果没有重写对应的弱别名,那​
45 么程序就默认执行中断处理函数(Default_Handler),​
46反之则执行用户重写了的中断处理函数。​
47 */​
48 /* weak,表示弱定义一个符号,符号名字叫​
49 .weak NMI_Handler ​
50 /* 如果没有重写这个弱定义的符号,则执行 Default_Handler,​
51反之则执行重写的NMI_Handler,以下其它中断函数同理​
52 */​
53 .thumb_set NMI_Handler,Default_Handler ​
54 ​
55 .weak HardFault_Handler​
56 .thumb_set HardFault_Handler,Default_Handler​
57 ​
58 /****** 此处省略部分代码 ******/​
59 .weak WAKEUP_PIN_IRQHandler​
60 .thumb_set WAKEUP_PIN_IRQHandler,Default_Handler​

第4到第8行,表示Default_Handler是一个无限空循环。

第14行表示定义了一个中断向量表的段,该段可分配,段内包含数据,这个表将会放置在地址为0x0000 0000处(也就是堆栈顶的地址),Cortex-M4复位后从此处取出数据用于初始化MSP寄存器。地址为0x0000 0004的表示复位向量(哪里得来的这些地址的?下面会结合一个Cortex-M4内核的中断映射表来讲解)。

第21到40行,定义了一个段来存放中断向量表,然后以字的形式分别填入了中断的指针。

第49到59行,startup_stm32mp15xx.s文件中已经帮我们写好所有中断的中断服务函数了,不过这些中断服务函数都是空的,什么也不运行,即无限空循环。真正的中断服务函数需要我们自己去实现。其中,中断服务函数前面定义了一个弱(weak)符号,弱,就是表示此函数可以进行重写(重新定义),表示如果用户在其它地方重新定义一个同名函数,最终编译器编译的时候,就会选择用户定义的函数,如果用户没有重新定义这个函数(或者函数名字写错了),那么编译器就会默认执行带有弱符号的函数,并且编译器不会报错。带有弱符号的函数都可以进行重写。

什么意思呢,例如我们看到有很多类似的代码,如这部分代码:

.weak UART4_IRQHandler ​
.thumb_set UART4_IRQHandler,Default_Handler​

.weak UART4_IRQHandler表示有一个中断处理函数,它的别名是UART4_IRQHandler,在前面有一个词weak(弱),表示此中断函数UART4_IRQHandler可以被用户进行重写(必须正确重写才会有效),重写的函数代替了这个函数。

.thumb_set UART4_IRQHandler表示如果不重写UART4_IRQHandler函数的话,那么默认执行Default_Handler函数,也就是执行死循环。weak的作用其实是为了防止用户使能了中断而没有编写中断服务函数,从而造成程序崩溃。

例如用户开启了串口4中断,根据前面中断向量表得出此中断服务函数名字为UART4_IRQHandler,如果用户只是开启中断,并没有去按照中断向量表给的中断函数名UART4_IRQHandler重写一个对应的中断处理函数(或者把中断函数名字写错了),那么,中断开启以后,系统默认执行Default_Handler,也就是一直执行死循环。如果按照中断向量表给的中断函数名UART4_IRQHandler重写了一个串口4的中断服务函数,那么中断向量表中的处理函数的地址就会更新为用户写的那个函数的地址了,即执行用户写的串口4中断函数,不会进入死循环。这点我们要注意,后面在中断有关实验章节会进行讲解怎么编写中断服务函数。

从第26到第40行是STM32MP157内部指定的中断向量表,我们也可以通过查看《STM32MP157参考手册》来了解Cortex-M4内核的中断映射关系,STM32MP157的M4内核中断管理器叫做NVIC,其系统中断(也叫内部中断)有10个,外部中断有150个,下图只是截图了一部分。

从表中了解到,地址0x0000 0000 是保留的,但其实是reset后MSP(主堆栈指针)的地址,Reset 中断的地址为0x0000 0004,NMI中断的地址是0x0000 0008。M4的中断映射范围0x0000 0000~00000x00000294。表中,priority 一列表示中断优先级,参数越小表示中断优先级越高。Fixed表示此中断优先级是固定的,不可更改,Settable表示中断优先级是可编程的,可以通过编程来更改。Acronym一列表示中断的名称,Description表示中断的说明,Address表示中断的地址。

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_寄存器_20


图6.3.5. 2参考手册部分截图

根据上表了解到,M4内核的中断向量表是从地址0x0000 0000开始的,位于BOOT区的RETRAM(64kB),我们在用MDK或者STM32CubeIDE来调试程序的时候,M4的代码其实是放到了SRAM中运行了,其中M4可运行的SRAM是SRAM1(128kB)、SRAM2(128kB)、SRAM3(64kB)和SRAM4(64kB),地址范围是0X10000000~0X1005FFFF,共384KB。如下的内存映射表可以清楚的看出内存映射关系:

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_Linux_21


图6.3.5. 3内存映射关系图

讲到这里发现还有一个疑问,在startup_stm32mp15xx.s文件中并没有看到有关设置堆和栈大小的代码,它是在哪里设置的呢?我们知道,栈一般是存放函数的参数值和局部变量的值,由编译器自动分配释放,而堆用于存放进程运行中被动态分配的内存段,一般由程序员分配和释放。若工程中使用的局部变量较多,定义的数据长度较大时,如果不调整栈的空间大小,会导致程序出现栈溢出,程序运行异常。在STM32CubeIDE中,堆和栈是在Project Manager配置窗口进行配置的。如下图,默认堆512B,栈1KB,用户可以在此处设置堆和栈的大小。

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_寄存器_22


图6.3.5. 4中设置堆栈

下面我们来捋一下启动文件的工作过程:

上电复位后,硬件会自动根据向量表偏移地址找到向量表,首先从0x0000 0000地址处加载初始MSP,然后从偏移为4的地址(0x0000 0004)处加载PC,0x0000 0004地址处存放的是Reset_Handler,即执行复位中断服务程,Reset_Handler主要做了两件事,一个是跳转到SystemInit函数完成必要的系统初始化,另外一个是跳转到main函数。然后,如果有中断发生,如果此中断对应的中断服务函数没有被用户重写,则系统进入无限空循环,如果此中断对应的中断函数被用户重写了,则执行用户重写的中断服务函数。

4. 系统启动流程

CM4内核启动,需要将拨码开关BOOT0、BOOT1和BOOT2设置为001,这个是芯片设计的时候就已经定好了的。STM32MP157 支持从多种不同的设备启动,通过设置拨码开关可以选择从指定的设备启动,启动方式如表:

BOOT0

BOOT1

BOOT2

启动模式

0

0

1

启动 M4 内核

1

0

1

SD 卡启动

1

0

0

NOR 启动

0

1

0

EMMC 启动

1

1

0

NAND 启动

0

1

1

USB/UART 启动

0

0

0

表6.3.5. 2启动模式

正点原子 STM32MP157 开发板上支持 USB、SD 卡、EMMC 以及 M4 内核这 4 种启动方式。

我们知道启动模式不同,启动的起始地址是不一样的,例如STM32F4系列的芯片,CM4内核有可用的FLASH,代码下载到内部FLASH时,代码从地址0x0800 0000开始被执行的。当产生复位,并且离开复位状态后,CM4内核做的第一件事就是读取下列两个32位整数的值:

(1)从地址 0x0800 0000 处取出堆栈指针MSP 的初始值,该值就是栈顶地址。

(2)从地址 0x0800 0004 处取出程序计数器指针PC的初始值,该值指向中断服务程序 Reset_Handler。下面用示意图表示,如下图所示。

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_链接脚本_23


图6.3.5. 5启动

换做STM32MP157,因为CM4内核没有可用的FLASH,所以在MDK或者STM32CubeIDE上仿真的时候,是将程序放到了SRAM中运行了。根据前面的分析,开发板从MCU启动,当产生复位,并且离开复位状态后,CM4内核做的第一件事:

(1)位于BOOT启动代码区RETRAM(64kB)的地址 0x0000 0000 处取出初始堆栈指针MSP 的初始值,该值就是栈顶地址。

(2)从地址0x00000004 处取出程序计数器指针PC的初始值,该值指向中断服务程序 Reset_Handler。下面用示意图表示,如下图所示。

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_寄存器_24


图6.3.5. 6内核启动

上述过程中,内核是从0x0000 0000和0x0000 0004两个的地址获取堆栈指针MSP和程序计数器指针PC。事实上,0x0000 0000和0x0000 0004两个的地址可以被重映射到其他的地址空间,因为可以通过修改定义宏VECT_TAB_SRAM以及修改向量表偏移VECT_TAB_OFFSET来实现,前面在system_stm32mp1xx.c文件中有介绍。

下面,我们看看第一个工程实验,在STM32CubeIDE上仿真的时候,MSP和PC的值是多少(注意,此值不再是初始值,已经发生变化了)。

进入Debug调试界面,然后打开Memmory窗口:

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_寄存器_25


图6.3.5. 7打开Memmory窗口

添加观察地址0x00000000:

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_Linux_26


图6.3.5. 8添加观察地址0x00000000

要注意,CM4内核是小端模式,所以读取下面的参数的时候,要倒着来读。0x0000 0000地址处的值是0x1004 0000,0x0000 0004的值是0x1000 3271,即堆栈指针 SP =0x1004 0000,程序计数器指针PC = 0x1000 3271(即复位中断服务程序Reset_Handler的入口地址)。

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_#define_27


图6.3.5. 9查看地址

当芯片上电后采样到BOOT0、BOOT1和BOOT2引脚电平为001,地址0x00000000和0x00000004被映射到内部SRAM的首地址0x1004 0000和0x1000 3271,内核从SRAM空间获取内容。在实际应用中,由启动文件startup_stm32mp15xx.s决定了0x00000000和0x00000004地址存储什么内容,编译后在链接时,由stm32mp15xx_m4.ld链接脚本决定这些内容的绝对地址,即分配SRAM的哪个位置。下面我们来看看这个链接脚本stm32mp15xx_m4.ld。

6.3.6 stm32mp15xx_m4.ld链接脚本

前面我们通过启动文件了解了系统复位后做了些什么工作,但我们并不知道内存的分配信息是怎样的,当然很多时候我们不需关心这些,只要确保程序能正常运行就可以。关于内存排布,我们这里会介绍一个重要的文件:链接脚本。

本小节中,在介绍链接脚本的时候,我们也会介绍两个和链接脚本关系比较重要的文件,一个是链接时产生的map文件,另一个是编译后生成的反汇编文件。本小节只是作为一个了解性的内容,如感兴趣可以了解一下,也可以跳过本小节。

1. 链接脚本

链接脚本路径:Device\ST\STM32MP1xx\Source\Templates\gcc\linker\stm32mp15xx_m4.ld

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_寄存器_28


图6.3.6. 1链接脚本路径

在Device\ST\STM32MP1xx\Source\Templates\下的arm、gcc和iar下均有一个文件夹linker,里边放的就是STM32MP1系列的链接描述文件,其中,在STM32CubeIDE下,链接脚本为.ld文件,在KEIL中,链接脚本为.sct文件,在IAR中,链接脚本为.icf文件。


当构建工程的时候,STM32CubeIDE会按照我们选择的芯片型号生成一个.ld的链接脚本,

链接脚本是用于描述文件应该如何被链接在一起形成最终的可执行文件的脚本,其主要目的是描述输入文件中的段(section)如何被映射到输出文件中,并且控制在输出文件中的内存排布。利用链接脚本我们可以控制代码的加载区以及执行区的位置

程序的编译一般分为预处理、汇编、编译和链接这4个步骤,我们在STM32CubeIDE上只需点击编译图标就一次性完成了这4个步骤,其中的操作细节IDE已经通过层层封装屏蔽掉了。在编译过程中,编译器将.c和.s源文件编译生成很多以.o结尾的中间文件,这些中间文件包含了只读数据段、代码段、数据段、未初始化数据段等机器码信息,但是这些信息是放在最终可执行文件的哪个位置并没有确定下来,于是,链接脚本会告诉链接器,把所有的中间文件链接起来,并重定向它们的数据,然后链接生成可以被单片机运行的.elf文件。如果要生成.bin格式的文件,只需要通过格式转换就可以完成。

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_Linux_29

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_Linux_30


图6.3.6. 2程序编译过程

我们先回顾一下前面的STM32CubeIDE第一个工程编译信息,可以打开工程重新编译,然后将编译的信息拷贝到一个.txt文本文件中,这样方便浏览信息。如下图是删除部分编译信息后的内容:

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_#define_31


图6.3.6. 3编译信息

编译生成的文件在工程的CM4\Debug下,在里边的文件夹中有生成的中间文件。编译结束后提示Build Finished. 0 errors, 0 warnings,没有报错,最终生成HAL_LED_CM4.elf二进制文件。如果有配置编译生成其它格式的执行文件,那么编译器会执行相应的指令以生成对应的文件,这些配置可以在STM32CubeIDE中设置。

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_#define_32


图6.3.6. 4配置编译生成的文件

如上图,设置编译生成.bin格式文件和反汇编文件,那么编译器在生成HAL_LED_CM4.elf文件以后,还会再执行以下指令:

arm-none-eabi-objdump -h -S HAL_LED_CM4.elf > "HAL_LED_CM4.list"​
arm-none-eabi-objcopy -O binary HAL_LED_CM4.elf "HAL_LED_CM4.bin"​

arm-none-eabi-objdump是反汇编指令,将 HAL_LED_CM4.elf文件进行反汇编,并生成HAL_LED_CM4.list文件。arm-none-eabi-objcopy命令表示复制一个目标文件的内容到另一个文件中,可用于不同文件之间的格式转换,最后将HAL_LED_CM4.elf格式转换成HAL_LED_CM4.bin文件。

STM32CubeIDE的这些编译过程都是由一个makefile文件来控制的,makefile里边是一些shell脚本,描控制工程的编译过程。关于makefile我们这里不做专门讲解,感兴趣的话,可以在网上查询更详细的说明,或者看正点原子的《STM32MP1嵌入式Linux驱动开发指南》《I.MX6U嵌入式Linux驱动开发指南V1.5》这两个教程,这两个教程是基于Linux操作系统的,对makefile有做部分介绍。

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_寄存器_33


图6.3.6. 5编译生成的文件

C语言程序编译完成以后,编译出来的代码一般都包含text、data、bss 和 rodata 这四个段(section)已初始化的全局变量保存在.data 段中,未初始化的全局变量保存在.bss 段中text和data段都在可执行文件中,程序运行的时候,由系统从可执行文件中加载。而bss段不在可执行文件中,由系统初始化并清零。四个段以及堆和栈的简单说明如下:

常见段

读写

内容

text

一般只读

代码段,程序源代码编译后的机器指令会放在代码段中,是用来存放程序执行代码的一块内存区域,这段区域的大小在编译的时候已经确定。

data

可读可写

存放程序中已初始化的全局变量或初始化为static的变量,属于静态内存分配。

bss

可读可写

未初始化或初始化为0的全局变量的一块内存区域,属于静态内存分配。

rodata

只读数据

只读数据段,存放常量数据,比如程序中定义为const的全局变量或者#define定义的常量等。

表6.3.6. 1代码中各个段简介

堆和栈

内容

程序运行过程中被动态分配的内存段,动态分配数据,手动申请(malloc)和释放(free)。

栈又称堆栈,存储的是函数或代码中的局部变量,也就是函数括弧“{}”中定义的变量(但不包括static声明的变量,static意味着在数据段中存放变量)。

表6.3.6. 2堆栈简介

前面有看到通过STM32MP157DAAX_RAM.ld链接脚本,生成了HAL_LED_CM4.elf文件,这个链接脚本是怎样工作的呢?我们先看几个链接脚本的语法,然后再去查看链接脚本的代码实现过程。

1)入口地址

ENTRY(SYMBOL)

ENTRY(SYMBOL) ,表示将符号SYMBOL的值设置成入口地址,即程序执行的第一条指令的地址。

2)内存区域定义

链接器在默认状态下可以为section 分配任意位置的存储区域,使用MEMORY命令可以用它来描述哪些内存区域可以被链接器使用,哪些内存区域避免使用。一个链接脚本最多可以包含一次MEMORY命令。

1 MEMORY​
2 {/* 名称 权限 起始地址 长度 */​
3 NAME [(ATTR)] : ORIGIN = ORIGIN, LENGTH = LEN ​
4 }​

NAME 是在链接脚本中引用内存区域的名字,每块内存区域有一个唯一的名字。ORIGIN是起始地址,LENGTH是地址的长度。ATTR字符串是该内存区域的属性,其中:

  • r表示读section
  • w表示写section
  • x表示执行section
  • a可表示分配的section
  • l(L)表示初始化了的section
  • ! 表示不满足该字符之后的任何一个属性的section

一旦定义了一个内存区域,就可以指示链接器把指定的输出段放入到这个内存区域中,方法是:通过使用'>region区域'。例如已经描述一个名为'mem'的内存区域,可以在输出段定义中使用'>mem'。

3)段链接定义

SECTIONS 命令是链接脚本里非常重要的命令,它的作用是:告诉链接器,如何把输入文件的sections映射到输出文件的各个section,如何把输出section放入地址空间。跟MEMORY命令一样,一个链接脚本里只有一个SECTIONS 命令。如果整个链接脚本内没有SECTIONS命令, 那么链接器将所有同名输入section合成一个输出section内, 各输入section的顺序为它们被链接器发现的顺序。

1 SECTIONS​
2 {​
3 .text :​
4 {​
5 start.o (.text)​
6 *(.text*)​
7 } >region​
8 }​

第 1 行先写了一个关键字“SECTIONS”,后面跟了一个大括号,这个大括号和第 8行

的大括号是一对,这是必须的。看起来就跟 C 语言里面的函数一样。

第3行,“.text”表示段名,段名后面先空2个空格,然后再有一个冒号,表示段定义。例如.text :表示定义一个.text段,这个段定义可以自己定,段名可以自己取。

第4行到第7行就是段的内容,这部分内容比较复杂。start.o (.text)表示将工程文件中的start.o的.text段(即代码段)链接到MEMORY定义的region中。*(.text*)中的*是通配符,表示将工程中所有目标文件的.text段链接到region中,在链接*(.text*) 时,不会重复链接start.o的.text段。

第7行的'>region'就表示指示链接器把上面花括号中指定的输出段放入到这个region内存区域中(内存区域是在前面的MEMORY中定义的)。

段的内容比较复杂,下面是一些常见的用法:

. = ALIGN(4):表示4字节地址对齐。也就是说段的起始地址要能被 4 整除,一般常见的都是 ALIGN(4)或者 ALIGN(8),也就是 4 字节或者 8 字节对齐。

PROVIDE和PROVIDE_HIDDEN关键字:表示在链接脚本文件中定义一个符号,这个符号没有被目标文件定义,但是被目标文件引用。

KEEP()关键字:KEEP() 的作用是当启用连接器的--gc-sections垃圾回收选项时,这部分不能被回收。如KEEP(*(.text))表示不能将所有的.text段当做垃圾回收。

/DISCARD/:是一个特殊的段名,如果使用这个段名作为输出,那么所有符合条件的段都被丢弃。

下面我们将stm32mp15xx_m4.ld文件的代码分为几个部分,查看链接脚本是怎样实现链接的。

1 程序入口,程序将从Reset Handler开始执行 */​
2 ENTRY(Reset_Handler)​
3 ​
4 /* 用户模式栈的最高地址,声明内存末尾地址 */​
5 _estack = 0x10040000; /* 堆栈末尾 = RAM起始地址 + RAM空间大小 */​
6 /* 定义了堆和栈的最小空间大小 */​
7 _Min_Heap_Size = 0x200; /* 堆大小 */​
8 _Min_Stack_Size = 0x400; /* 栈大小 */​
9 ​
10 /* 内存定义,‘MEMORY’ 命令描述目标平台上内存块的位置与长度 */​
11 MEMORY​
12 {/* 名称 权限(读R/写W/执行X) 起始地址 长度 */​
13 m_interrupts (RX) : ORIGIN = 0x00000000, LENGTH = 0x00000298​
14 m_text (RX) : ORIGIN = 0x10000000, LENGTH = 0x00020000​
15 m_data (RW) : ORIGIN = 0x10020000, LENGTH = 0x00020000​
16 m_ipc_shm (RW) : ORIGIN = 0x10040000, LENGTH = 0x00008000​
17 }​
18 ​
19 /* OpenAMP启用rpmsg所需的符号 */​
20 __OPENAMP_region_start__ = ORIGIN(m_ipc_shm);​
21 __OPENAMP_region_end__ = ORIGIN(m_ipc_shm)+LENGTH(m_ipc_shm);​

第2行,程序入口,程序将从Reset Handler函数开始执行,该函数在启动文件startup_stm32mp15xx.s中有定义。

第5行,设置堆栈的最高地址为0x10040000,这里注意了,它决定了SP的位置,0x10040000就是我们前面分析startup_stm32mp15xx.s文件时系统启动流程小节里仿真时得到的SP地址0x0000 0000映射到内部SRAM的地址。

第7、8行,定义了堆和栈的最小空间大小,其中,设置堆大小为512B,栈大小为1KB。

第11到17行,以MEMORY命令定义了系统中可用于放置代码和数据的内存区域:

区域名为m_interrupts的地址范围是0x00000000~0x00000298,这个范围也就是M4内核中断向量表的范围,对应前面内存映射关系图中的RETRAM区域;

m_text区域的地址范围是0x10000000~0x10020000,刚好对应内存映射关系图中的SRAM1区域,链接的是tex代码段(Code)

m_data区域的范围是0x10020000~0x10040000对应内存映射关系图中的SRAM2区域,链接的是数据段(Data)

m_ipc_shm区域的范围是0x10040000~0x10048000此范围落在了SRAM3中,ipc(Inter Process Communicaton)即进程通信,这个区域可以作为IPC缓冲区(IPC Buffers),也可以用于其它用途

以上的链接地址就是程序的执行地址,找到链接地址了就知道程序是在哪里执行了。我们前面有提到内存映射关系图,在IDE中调试程序的时候,M4的代码其实是放到了SRAM中运行了,其中M4可的SRAM是SRAM1(128kB)、SRAM2(128kB)、SRAM3(64kB)和SRAM4(64kB),地址范围是0x10000000~0x1005FFFF,共384KB如果只是M4跑裸机或者RTOS,不运行A7的话,这SRAM1~SRAM4可以全部分配给M4那如果要同时运行M4和A7的话,这些地址分配就要注意了:根据MEMORY命令定义的地址范围,我们知道m_text、m_data和m_ipc_shm占用了SRAM1~SRAM3,SRAM1、SRAM2是完全分配给M4了,这里注意,如果要运行A7的话,M4并不是完全占用SRAM3,具体占用多少需要根据Linux下的设备树配置来决定,在A7和M4双核通信中,默认A7和M4共同占用SRAM3的0x10040000~0x10046000,这部分地址作为A7和M4通信的内存交换区,内核下的设备树如下:

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_寄存器_34


图6.3.6. 6设备树部分截图

而m_interrupts其实是在RETRAM里,剩下的SRAM4用于做什么呢?如果不跑Linux操作系统,只是跑M4裸机程序的话,M4内核完全可以使用这部分区域,由用户来指定。如果跑Linux操作系统,在Linux设备树下已经默认将SRAM4当做了Linux功能的DMA了,如果要释放这部分区域,在设备树下将对应节点删除释放即可(但不建议这么做,A7可能会异常)

根据上述描述,这几个区域对应关系如下图,从图中可以明显看出SRAM的地址分配情况:

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_#define_35


图6.3.6. 7几个SRAM区域

综合以上分析,总结如下:

如果不跑A7,只运行M4(M4可以跑裸机、RTOS):SRAM1~SRAM4可以完全分配给M4;

如果同时跑A7和M4(例如双核通信):SRAM1和SRAM2是单独给M4用的,SRAM3的部分地址是M4和A7一起使用的,SRAM4在Linux下单独配置了DMA,即被A7占用了。

如果要修改MEMORY中的地址区域范围,一定要联系内存映射表的地址范围来修改。

接下来是SECTIONS段链接定义,内容比较多已经省略部分:

1 /* SECTIONS关键字,用来描述输出文件各个section的布局 */​
2 SECTIONS​
3 {​
4 /* 将中断向量的内容链接到m_interrupts地址 */​
5 .isr_vector : /*.isr_vector在startup_stm32mp15xx.s文件中有定义 */​
6 {​
7 . = ALIGN(4); /* 4字节对齐,要求段的起始地址要能被4整除 */​
8 KEEP(*(.isr_vector)) /* 此处KEEP保证isr_vector的输出段不会被删除 */​
9 . = ALIGN(4);​
10 } > m_interrupts /* 地址为0x00000000-0x00000298*/​
11 /* 将程序代码和其他数据链接到m_text区域 */​
12 .text : /* .text对应程序的可执行代码 */​
13 {​
14 . = ALIGN(4);​
15 *(.text) /* 将所有输入文件.o的代码段链接到MEMORY定义的m_text */​
16 *(.text*) /*将所有目标文件的.text段链接到 m_text中 */​
17 *(.glue_7) /* glue arm to thumb code */​
18 *(.glue_7t) /* glue thumb to arm code */​
19 *(.eh_frame) /* .eh_frame 用于处理异常 */​
20 KEEP (*(.init))​
21 KEEP (*(.fini))​
22 . = ALIGN(4);​
23 /* _etext是链接器的预定义变量,代表程序正文段结束的第一个地址 */​
24 _etext = .; /* 在代码末尾定义一个全局符号 */​
25 } > m_text​
26 /* 将常量数据链接到m_text */​
27 .rodata : ​
28 {​
29 . = ALIGN(4);​
30 *(.rodata) /* .rodata 段 (常亮、字符串等) */​
31 *(.rodata*) /* .rodata* 段 (常亮、字符串等) */​
32 . = ALIGN(4);​
33 } > m_text​
34 /******* 省略部分代码 *******/​
35 /* 初始化数据段 */ ​
36 .data : AT(__DATA_ROM)​
37 {​
38 . = ALIGN(4);​
39 _sdata = .; /* 创建全局符号 */​
40 *(.data) /* .data 段 */​
41 *(.data*) /* .data* 段 */​
42 . = ALIGN(4);​
43 _edata = .; ​
44 } > m_data​
45 /******* 省略部分代码 *******/​
46 /* 将程序中未初始化的全局变量链接到m_data中 */​
47 . = ALIGN(4);​
48 .bss : ​
49 {​
50 /******* 省略部分代码 *******/​
51 } > m_data​
52 /*用于检查剩余的RAM是否足够 */​
53 ._user_heap_stack :​
54 {​
55 /******* 省略部分代码 *******/​
56 } > m_data​
57 /* 从编译器库中删除以下信息 */ ​
58 /DISCARD/ :​
59 {​
60 /******* 省略部分代码 *******/​
61 }​
62 .ARM.attributes 0 : { *(.ARM.attributes) }​
63 }​

根据注释以及前面讲解的语法,整个链接脚本也很容易看懂。

第5到第10行,表示中断向量的内容,地址为0x00000000~0x00000298,这个区域是RETRAM。

第24行,_etext = .;中的小数点.表示当前地址,意思是_etext =的地址就是.text段的地址。

一般的程序中包含常见的几个段:text、rodata、data和bss段,这一部分实际上指定了程序的各个内容该如何放置在SRAM上。

在STM32CubeIDE上可以直接查看这些段的信息例如第一个工程实验HAL_LED,编译完成以后,点击Window菜单àShow ViewàBuild Analyzer打开Build Analyzer窗口查看注意,此时不是在Debug调试看的,是编译后查看的

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_#define_36


图6.3.6. 8选择打开Build Analyzer窗口

在Build Analyzer窗口中可以查看内存使用情况。其中在Memory Regions处可以看到m_interrupts、m_text、m_data和m_ipc_shm的起始地址和结束地址,范围大小,以及使用量和剩余量。

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_链接脚本_37


图6.3.6. 9窗口

在Memory Details处可以查看更详细的信息VMA是虚拟地址,一般是RAM位置这里指运行地址,LMA一般是加载地址,即ROM位置

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_寄存器_38


图6.3.6. 10信息

通过链接脚本的内容,我们大概知道每段链接到了哪段内存区域,程序的链接地址一般也就等于运行地址(这点大家要记住)。其实我们也可以通过查看.map文件和反汇编文件来进一步研究我们链接脚本和代码的实现,下面我们分两个部分来讲解这两个文件。

2. MAP(地图)文件

我们编写的代码,在IDE上经过编译和链接以后会生成一个.elf格式的文件,同时也会生成一个.map格式的文件,如前面我们看到的HAL_LED_CM4.map文件。map就是地图、示意图的意思,map文件是链接器的输出,提供有关所生成的.elf文件中的符号、地址和分配的内存的信息,当试图了解调试的程序大小和内存使用情况时,map文件非常有用。

我们打开前面的HAL_LED_CM4.map文件,查看文件中都有什么内容,下面的截图中,由于文件路径比较长,于是只截图了一部分。

Archive member included to satisfy reference by file (symbol)部分:

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_链接脚本_39


图6.3.6. 11存档文件部分

此部分属于存档文件,通常存储目录结构,包含系统中各种归档文件中包含的所有成员,以满足文件(符号)的引用,这些信息并不是特别有用,但是可以看到所有的系统功能。

Allocating common symbols部分:

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_寄存器_40


图6.3.6. 12符号分配部分

此部分是常见的符号分配,显示了已在程序中分配的全局符号(即全局变量)的名称和大小,这是检查所有全局变量是否具有预期大小的好地方。一个常见的错误可能是在不知情的情况下,分配了一个大的全局变量,这会消耗大量内存空间。通过此处可以了解到工程中使用的全局变量的名称和大小,如果大小不合理,可以在工程中稍微调整。

Discarded input sections部分:

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_寄存器_41


图6.3.6. 13丢弃的输入部分

此部分是丢弃的输入部分,很多时候可以不用管。

Memory Configuration部分:

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_Linux_42


图6.3.6. 14内存配置信息部分

此部分属于内存配置信息,这部分的信息应该与链接脚本中的内存配置范围相同。

Linker script and memory map部分:

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_Linux_43


图6.3.6. 15内存映射

此部分详细说明了按链接脚本文件中定义的部分而划分的内存映射,其提供了有关程序中所有内容映射位置的大量信息。每个顶级节(例如.text)都具有内存映射中的起始地址以及列出的大小(以字节为单位)。然后,将每个部分细分为各个目标文件,并列出起始地址和大小。最后,每个目标文件都分解为目标文件中的各个功能,并列出了每个功能的起始地址。这可以帮助我们能够了解哪些目标文件可能包含程序执行不必要的大功能。当查看程序中的指针地址时,它也可以提供上下文。

我们可以通过配置IDE来选择是否生成.map文件,选中工程,打开Properties配置项,点击C/C++ Build--Settings--MCU GCC Linker找到链接器的配置项General,如下图是系统默认的配置项,其中:

  • Linker Script(-T)是配置用哪个链接脚本,如果您有自己的链接脚本,也可以在此处配置以选择使用自己的链接脚本。
  • Generate map file (-Wl,-Map=)此项表示是否要生成.map文件,一般是默认选择的,如果不需要生成.map文件,可以去掉此项。
  • Do not use standard start files (-nostartfiles)表示链接时不要使用标准的启动文件(-nostartfiles),此项一般不选,因为我们要用到启动文件。
  • No startup or default libs(-nostdlib)表示没有启动库或默认库(-nostdlib)。
  • Do not use default libraries(-nodefaultlibs)表示不要使用默认库(-nodefaultlibs)。

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_Linux_44


图6.3.6. 16配置

其它选项一般不需要再配置,如果有必要,可以尝试配置,例如Add symbol cross reference table to map file(-Wl--cref)表示将符号打印出来,并按名称排序。如果勾选此项,对于每个符号,会给出一个文件名列表,如果定义了符号,则列出的第一个文件是定义的位置,其余文件包含对该符号的引用。

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_#define_45


图6.3.6. 17其它配置

调试程序时,map文件是信息的重要来源,它记录项目中每一个Symbol的地址、每个段的区域范围、各区段的大小等重要信息,可以通过map文件查看程序段或数据段的大小,查看高地址数据范围等等。尽管map文件的信息非常密集并且有些令人生畏,但理解和使用map文件可以为我们提供很多有用的信息。

3. 反汇编文件

把机器语言转换为汇编语言代码的过程,我们叫反汇编(Disassembly)。反汇编常用于软件破jie、软件汉化、病du分析等。理解反汇编语言,对C语言代码理解、软件调试、程序漏洞分析是很有帮助的,大多数情况下我们都是用 C 语言写试验例程的,有时候需要查看其汇编代码来进行调试。STM32CubeIDE已经自动将HAL_LED_CM4.elf文件反汇编得到HAL_LED_CM4.list文件了,我们打开此文件大概浏览一下:

1 HAL_LED_CM4.elf: file format elf32-littlearm​
2 ​
3 Sections:​
4 Idx Name Size VMA LMA File off Algn​
5 0 .isr_vector 00000298 00000000 00000000 00010000 2**0​
6 CONTENTS, ALLOC, LOAD, READONLY, DATA​
7 1 .text 0000255c 10000000 10000000 00020000 2**2​
8 CONTENTS, ALLOC, LOAD, READONLY, CODE​

如上是反汇编文件开头的部分代码,第1行表示由HAL_LED_CM4.elf文件反汇编得到文件,文件格式是elf32位的,且是小端模式存放。第3行表示要列出段,接下来第4段到第8端列出段,其中Idx表示索引,Name表示段名,Size表示该段的大小。VMA是虚拟地址,一般是RAM位置,LMA一般是加载地址,即ROM位置。File off表示段所在位置(指距离.elf文件的 Header 00000000)的偏移。

CONTENTS、ALLOC、LOAD、READONLY、DATA这些表示段的属性。

  • CONTENTS表示该段在文件中具有相应的内容;
  • ALLOC表示该部分占用内存;
  • LOAD表示该段在可加载段中,当创建进程时,其内容可以从文件读入存储器;
  • READONLY表示该段不可执行,也不可写;
  • DATA表示该段不可执行,但可写;
  • CODE表示包含要执行的指令。

例如.text这段,它包含程序可执行的代码,所以显示CONTENTS;该部分占用内存,所以显示ALLOC;它的内容从文件中加载,所以显示LOAD;编译好的程序代码是不可修改的,它放置在只读存储器中,所以显示READONLY;.text段包含要执行的指令,因此显示CODE。

我们再看之后的反汇编部分:

1 Disassembly of section .text:​
2 ​
3 10000000 <__do_global_dtors_aux>:​
4 10000000: b510 push {r4, lr}​
5 10000002: 4c05 ldr r4, [pc, #20] ; (10000018 <__do_global_dtors_aux+0x18>)​
6 10000004: 7823 ldrb r3, [r4, #0]​

第1行,说明反汇编文件是.text段。

第3行,10000000表示指令地址。

第4行,10000000表示指令地址,b510表示指令机器码,push {r4, lr}表示指令机器码反汇编得到的指令。

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_寄存器_46


在反汇编文件中找到如上图代码,Reset_Handler处指令地址是0x10003270,和我们前面分析startup_stm32mp15xx.s文件时系统启动流程小节里仿真时得到的PC = 0x1000 3271很相近,说明和我们前面猜想的一样。

查看反汇编代码,里边的地址从低到高排列,最高地址是0x10040000,这个是因为链接脚本里有定义栈的最高地址为_estack = 0x10040000,如果将_estack = 0x10040000改为_estack = 0x10020000,再编译工程,可以看到反汇编文件中最高的地址变成了0x10020000也就是SP地址有原来的0x10040000变成了0x10020000),可以看到.text段的VMA(SRAM的地址)地址是0x10000000,这是前面的链接脚本中定义的m_text区域的起始地址,如果把m_text区域的地址进行调整,例如起始地址改为0x10000100,编译后,汇编文件中.text段的VMA地址就变成了0x10000100。

反汇编的好处是可以帮助我们理解链接脚本,有时候可能我们会自己写链接脚本,通过查看反汇编文件可以帮助我们检查链接脚本的错误。

6.3.7 Include文件夹

Include文件夹下是符合CMSIS标准的内核头文件,我们在使用STM32CubeIDE创建工程的时候,系统会自动为我们添加这部分文件。

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_寄存器_47


图6.3.7. 1文件夹内容

这些文件中,以cmsis开头的是和CMSIS编译器相关的文件,core开头的是和 Cortex-M 内核相关的文件, MPU开头的是和MPU相关的文件。普通的工程我们只需要cmsis_compiler.h、cmsis_gcc.h、cmsis_version.h、core_cm4.h和mpu_armv7.h就可以了,如果是特殊的工程,则还会需要其它文件,例如和TrustZone安全方面相关的工程,那就需要tz_context.h文件。在这些文件中,我们这里稍微关注core_cm4.h 内核文件,至于其它文件,如果有想要深入学习内核的朋友可以配合内核相关的手册去学习。下面,我们简单介绍core_cm4.h这个文件。

如下,我们看到core_cm4.h文件包含了stdint.h文件:

#include <stdint.h>​

stdint.h是C99 (C语言规范)中引进的一个标准C库的头文件,其定义了几种扩展的整数类型和宏。现在编译器对C99的支持已经做的很好了,大部分单片机C编译器均支持C99标准,例如IAR、MDK和STM32CubeIDE等,linux 系统下的编译器也支持。在STM32CubeIDE安装目录\plugins\com.st.stm32cube.ide.mcu.externaltools.gnu-tools-for-stm32.7-2018-q2-update.win32_1.4.0.202007081208\tools\arm-none-eabi\include下就有stdint.h文件。stdint.h的作用就是提供了类型定义,其包含了_intsup.h和_stdint.h文件。

1 #ifndef _STDINT_H​
2 #define _STDINT_H​
3​
4 #include <machine/_default_types.h>​
5 #include <sys/_intsup.h>​
6 #include <sys/_stdint.h>​

这些文件中定义了我们程序中用到的部分类型,在IDE上可以找到这些定义的实际类型,例如,通过查找,得出__UINT32_TYPE__表示long unsigned int,而:

1 typedef __UINT32_TYPE__ __uint32_t;​
2 typedef __uint32_t uint32_t ;​

所以,今后我们在程序中看到的uint32_t实际上表示long unsigned int(无符号长整型),而uint8_t表示unsigned char(无符号字符型),int8_t表示signed char等。

在core_cm4.h文件中,我们还看到很多关于中断相关的函数定义和类型定义,例如,开启中断函数NVIC_EnableIRQ、禁止中断函数NVIC_DisableIRQ、设置中断优先级分组函数NVIC_SetPriorityGrouping和中断优先级函数NVIC_SetPriority,这些函数会在HAL库中调用以实现中断功能。此外,还有内核的外设相关定义,如SysTick实时系统内核时钟相关寄存器和函数都在core_cm4.h文件中定义。如下是中断控制器(NVIC)类型定义。

《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_Linux_48


图6.3.7. 2中断控制器(NVIC)类型定义

core_cm4.h文件就介绍到这里了,在这里我们不对core_cm4.h文件的内容做深入的讲解,相关的介绍我们后面会结合实验例程来加深理解。

6.4 章节小结

本章节洋洋洒洒地写了几十页,并不是为了拉长战线和故意占用篇幅”, 实际上,要好好学习HAL库,要分析的东西还不仅仅这些。大家都知道,ST提供的这个固件库已经封装好了,在开发中我们只需要调用对应的API就可以实现想要的功能。不管它封装的多好,本质上还是操作寄存器。我们在学习过程中,不能只停留在理解的表面上,应该尝试去理解它的本质上的东西,通过分析,我们可以理解它的架构,这有助于日后的学习和开发。

本章节主要对STM32CubeMP1固件包的架构以及CMSIS文件夹中的部分重要文件做了介绍,重点对我们后面会用的CMSIS文件夹下的Device文件夹以及Include文件夹中的部分文件做了介绍。

  • 通过分析stm32mp1xx.h文件,我们可以确定代码中是否使用或者不使用某个底层驱动文件。通过定义宏CORE_CM4、STM32MP157Dxx和USE_HAL_DRIVER,我们可以在工程中包含必要的头文件,如果换了另一款STM32芯片,我们同样可以通过分析对应头文件来确定这些信息。
  • 《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_#define_49


  • 图6.3.7. 3几个宏定义
  • 通过分析stm32mp157dxx_cm4.h头文件,我们知道了固件库中对STM32MP157dxx系列器件的设备资源采用结构体的形式进行了封装,如果我们要访问某个寄存器,只需要定义一个结构体指针,然后通过指针来读写对应的寄存器(结构体成员)就可以了,HAL库中就是采用这样的方式来操作外设的寄存器的。
  • 通过分析system_stm32mp1xx.c文件,我们认识了系统初始化函数SystemInit、系统时钟更新函数SystemCoreClockUpdate和SystemCoreClock全局变量,同时也了解了怎么开启STM32MP1的硬件 FPU 功能。
  • 通过分析startup_stm32mp15xx.s启动文件,我们知道了main函数并不是程序执行的第一段代码。上电后,通过boot引脚设置可以将中断向量表定位于起始地址0x0000 0000,同时复位后PC指针位于0x00000004地址处(Reset_Handler),Reset_Handler主要做了两件事,一个是跳转到SystemInit函数完成必要的系统初始化,另外一个是跳转到main函数入口。
  • 《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_MP157_50


  • 图6.3.7. 4系统启动过程
  • 通过分析stm32mp15xx_m4.ld链接脚本,我们知道了编译好的输入文件中的每个段是如何被映射到输出文件中的,其中,text代码段位于SRAM1,data数据段位于SRAM2。此外,我们还分析了HAL_LED_CM4.map地图文件和HAL_LED_CM4.list反汇编文件,编译生成的.elf文件中的符号、地址和分配的内存的信息都可以地图文件中查看反汇编文件可以辅助我们检查代码的缺陷,在实际项目开发中,这些文件是非常重要的。
  • 《STM32MP1 M4裸机CubeIDE开发指南》第六章 STM32Cube固件包_Linux_51


  • 图6.3.7. 5M4内核可用的SRAM
  • Inclue文件夹下主要是符合CMSIS标准的内核头文件M4裸机开发中,我们主要用的是core_cm4.h文件,此文件中主要是关于中断相关的函数定义和类型定义,还有内核的外设相关寄存器的定义,例如核外设SysTick