汇编语言

1、一个ARM汇编语言源程序的基本结构：

AREA Init, CODE, READONLY

ENTRY

Start

LDR R0, =0x3FF5000

LDR R1, 0xFF

STR R1, [R0]

LDR R0, =0x3FF5008

LDR R1, 0x01

STR R1, [R0]

... ... ... ... ... ...

END

在 ARM( Thumb)汇编语言程序中，以程序段为单位组织代码。

段是相对独立的指令或数据序列，具有特定的名称。段可以分为代码段和数据段，代码段的内容为执行代码，数据段存放代码运行时需要用到的数据。一个汇编程序至少应该有一个代码段，当程序较长时，可以分割为多个代码段和数据段，多个段在程序编译链接时最终形成一个可执行的映象文件。

可执行映象文件通常由以下几部分构成：

— 一个或多个代码段，代码段的属性为只读。

— 零个或多个包含初始化数据的数据段，数据段的属性为可读写。

— 零个或多个不包含初始化数据的数据段，数据段的属性为可读写。

链接器根据系统默认或用户设定的规则，将各个段安排在存储器中的相应位置。因此源程序中段之间的相对位置与可执行的映象文件中段的相对位置一般不会相同。

在汇编语言程序中，用 AREA 伪指令定义一个段，并说明所定义段的相关属性，本例定义一个名为 Init 的代码段，属性为只读。 ENTRY 伪指令标识程序的入口点，接下来为指令序列，程序的末尾为 END 伪指令，该伪指令告诉编译器源文件的结束，每一个汇编程序段都必须有一条 END 伪指令，指示代码段的结束。

2、一个ARM汇编语言的子程序调用

AREA Init, CODE, READONLY

ENTRY

Start

LDR R0, =0x3FF5000

LDR R1, 0xFF

STR R1, [R0]

LDR R0, =0x3FF5008

LDR R1, 0x01

STR R1, [R0]

BL PRINT_TEXT

... ... ... ... ... ...

PRINT_TEXT

... ... ... ... ... ...

MOV PC，BL

... ... ... ... ... ...

END

在 ARM 汇编语言程序中，子程序的调用一般是通过 BL 指令来实现的。

在程序中，使用指令：

BL 子程序名

即可完成子程序的调用

该指令在执行时完成如下操作：将子程序的返回地址存放在连接寄存器 LR 中，同时将程序计器 PC 指向子程序的入口点，当子程序执行完毕需要返回调用处时，只需要将存放在 LR 中的返回地址重新拷贝给程序计数器 PC 即可。在调用子程序的同时，也可以完成参数的传递和从子程序返回运算的结果，通常可以使用寄存器 R0 ～ R3 完成。

（直接点击图片可进入调查页面）

围观 348

在ARM处理器汇编语言程序设计里，有一些特殊的指令助记符。这些助记符与指令系统的助记符不同，没有相对应的操作码，通常称这些特殊的指令助记符为伪指令，它们所完成的操作称为伪操作。

伪指令在源程序中的作用是为完成汇编程序做各种准备工作的，这些伪指令仅在汇编过程中起作用，一旦汇编结束，伪指令的使命就完成了。在ARM处理器的汇编程序中，大体有如下几种伪指令：符号定义伪指令、数据定义伪指令、汇编控制伪指令、宏指令及其他伪指令。

伪操作符可以分为以下几类。

1）数据定义伪操作符

数据定义伪操作符主要包括LTORG、MAP、DCB、FIELD、SPACE、DCQ、DCW等，主要用于数据表定义、文字池定义、数据空间分配等。常用的有DCB/DCQ/DCW分配一段字节/双字/字内存单元，并且将它们初始化。

2）符号定义伪操作符

符号定义伪操作符包括GBLA、GBLL、GBLS、LCLA、CN、CP、DN、FN、RLIST、SETA等，用于定义ARM汇编程序的变量，对变量进行赋值，以及定义寄存器名称等。其中用于全局变量声明的GBLA、GBLL、GBLS和局部变量声明的LCAL、LCLL、LCLS伪指令较为常用。

3）报告伪操作符

报告伪操作符包括ASSERT、INFO、OPT等，主要用于汇编报告等。其中比较常用的有ASSERT，表示断言错误。

4）条件汇编伪操作符

条件汇编伪操作符包括IF、ELSE、ENDIF、WHIL、WEND、MACRO、MEND等，主要用于条件汇编、宏定义、重复汇编控制等操作。

5）杂项伪操作符

杂项伪操作符包括AREA、ALIGN、ENTRY、EQU、EXPORT、GLOBAL、IMPORT、CODE16、CODE32等。这些伪指令在汇编程序设计中较为常用，如段定义、入口点设置等伪指令。常用的伪指令主要有以下几条。

AREA：用来定义段；

ALIGN：用来设定边界对齐；

CODE16/CODE32：用来指定指令集；

ENTRY：指定程序入口；

END：汇编结束。

1、符号定义（ Symbol Definition ）伪指令
　　　　
符号定义伪指令用于定义 ARM 汇编程序中的变量、对变量赋值以及定义寄存器的别名等操作。

常见的符号定义伪指令有如下几种：

— 用于定义全局变量的GBLA 、GBLL 和 GBLS

— 用于定义局部变量的 LCLA 、LCLL 和 LCLS

— 用于对变量赋值的 SETA 、SETL 、SETS

— 为通用寄存器列表定义名称的 RLIST

GBLA、GBLL 和GBLS

　　　　
语法格式：

GBLA(GBLL或GBLS)全局变量名

GBLA、GBLL和GBLS伪指令用于定义一个 ARM 程序中的全局变量，并将其初始化。

其中：

GBLA 伪指令用于定义一个全局的数字变量，并初始化为 0；

GBLL 伪指令用于定义一个全局的逻辑变量，并初始化为 F；

GBLS 伪指令用于定义一个全局的字符串变量，并初始化为空；

由于以上三条伪指令用于定义全局变量，因此在整个程序范围内变量名必须唯一。

使用示例：

GBLA Test1 ；定义一个全局的数字变量，变量名为 Test1

Test1 SETA 0xaa ；将该变量赋值为 0xaa

GBLL Test2 ；定义一个全局的逻辑变量，变量名为 Test2

Test2 SETL {TRUE} ；将该变量赋值为真

GBLS Test3 ；定义一个全局的字符串变量，变量名为 Test3

Test3 SETS " Testing " ；将该变量赋值为 " Testing "

LCLA、LCLL 和LCLS语法格式：

语法格式：

LCLA （ LCLL 或 LCLS ）局部变量名

LCLA 、 LCLL 和 LCLS 伪指令用于定义一个 ARM 程序中的局部变量，并将其初始化。

其中：

LCLA 伪指令用于定义一个局部的数字变量，并初始化为0；

LCLL 伪指令用于定义一个局部的逻辑变量，并初始化为F（假）；

LCLS 伪指令用于定义一个局部的字符串变量，并初始化为空；

以上三条伪指令用于声明局部变量，在其作用范围内变量名必须唯一。

SETA、SETL 和SETS

　　　　
语法格式：

变量名 SETA （ SETL 或 SETS ）表达式:

伪指令 SETA 、 SETL 、 SETS 用于给一个已经定义的全局变量或局部变量赋值。

SETA 伪指令用于给一个数学变量赋值；

SETL 伪指令用于给一个逻辑变量赋值；

SETS 伪指令用于给一个字符串变量赋值；

RLIST

　　　　
语法格式：

名称 RLIST { 寄存器列表 }

RLIST 伪指令可用于对一个通用寄存器列表定义名称，使用该伪指令定义的名称可在 ARM 指令 LDM/STM 中使用。

在 LDM/STM 指令中，列表中的寄存器访问次序为根据寄存器的编号由低到高，而与列表中的寄存器排列次序无关。

使用示例：

RegList RLIST {R0-R5，R8，R10}；

将寄存器列表名称定义为 RegList，可在 ARM 指令 LDM/STM中通过该名称访问寄存器列表。

2、数据定义（ Data Definition ）伪指令

数据定义伪指令一般用于为特定的数据分配存储单元，同时可完成已分配存储单元的初始化。

常见的数据定义伪指令有如下几种：

— DCB用于分配一片连续的字节存储单元并用指定的数据初始化。

— DCW（DCWU）用于分配一片连续的半字存储单元并用指定的数据初始化。

— DCD（DCDU）用于分配一片连续的字存储单元并用指定的数据初始化。

— DCFD（DCFDU）用于为双精度的浮点数分配一片连续的字存储单元并用指定的数据初始化。

— DCFS（DCFSU）用于为单精度的浮点数分配一片连续的字存储单元并用指定的数据初始化。

— DCQ（DCQU）用于分配一片以 8 字节为单位的连续的存储单元并用指定的数据初始化。

— SPACE用于分配一片连续的存储单元

— MAP 用于定义一个结构化的内存表首地址

— FIELD 用于定义一个结构化的内存表的数据域

DCB

　　　　
语法格式：

标号 DCB 表达式

DCB 伪指令用于分配一片连续的字节存储单元并用伪指令中指定的表达式初始化。其中，表达式可以为 0 ～ 255 的数字或字符串。 DCB 也可用 " = " 代替。

使用示例：

Str DCB " This is a test ！ " ；分配一片连续的字节存储单元并初始化。

DCW（或DCWU）

　　　　
语法格式：

标号 DCW （或 DCWU ）表达式

DCW （或 DCWU ）伪指令用于分配一片连续的半字存储单元并用伪指令中指定的表达式初始化。

其中，表达式可以为程序标号或数字表达式。。

用 DCW 分配的字存储单元是半字对齐的，而用 DCWU 分配的字存储单元并不严格半字对齐。

使用示例：

DataTest DCW 1，2，3；分配一片连续的半字存储单元并初始化。

DCD（或DCDU）

　　　　
语法格式：

标号 DCD （或 DCDU ）表达式

DCD（或 DCDU）伪指令用于分配一片连续的字存储单元并用伪指令中指定的表达式初始化。其中，表达式可以为程序标号或数字表达式。DCD 也可用"& "代替。

用 DCD 分配的字存储单元是字对齐的，而用 DCDU 分配的字存储单元并不严格字对齐。

使用示例：

DataTest DCD 4，5，6；分配一片连续的字存储单元并初始化。

DCFD（或DCFDU）

　　　　
语法格式：

标号 DCFD （或 DCFDU ）表达式

DCFD （或 DCFDU ）伪指令用于为双精度的浮点数分配一片连续的字存储单元并用伪指令中指定的表达式初始化。

每个双精度的浮点数占据两个字单元。用 DCFD 分配的字存储单元是字对齐的，而用 DCFDU 分配的字存储单元并不严格字对齐。

使用示例：

FDataTest DCFD 2E115，-5E7；分配一片连续的字存储单元并初始化为指定的双精度数。

DCFS（或DCFSU）

　　　　
语法格式：

标号 DCFS （或 DCFSU ）表达式

DCFS （或 DCFSU ）伪指令用于为单精度的浮点数分配一片连续的字存储单元并用伪指令中指定的表达式初始化。

每个单精度的浮点数占据一个字单元。用 DCFS 分配的字存储单元是字对齐的，而用 DCFSU 分配的字存储单元并不严格字对齐。

使用示例：

FDataTest DCFS 2E5，-5E－7；分配一片连续的字存储单元并初始化为指定的单精度数。

DCQ(或DCQU）

　　　　
语法格式：

标号 DCQ （或 DCQU ）表达式

DCQ （或 DCQU ）伪指令用于分配一片以 8 个字节为单位的连续存储区域并用伪指令中指定的表达式初始化。

用 DCQ 分配的存储单元是字对齐的，而用 DCQU 分配的存储单元并不严格字对齐。

使用示例：

DataTest DCQ 100 ；分配一片连续的存储单元并初始化为指定的值。

SPACE

语法格式：

标号 SPACE 表达式 - K7 ]' L4 `) T4 @8 H

SPACE 伪指令用于分配一片连续的存储区域并初始化为 0 。其中，表达式为要分配的字节数。

SPACE 也可用"％"代替。

使用示例：

DataSpace SPACE 100；分配连续 100 字节的存储单元并初始化为 0 。

MAP

语法格式：

MAP 表达式 { ，基址寄存器 }

MAP 伪指令用于定义一个结构化的内存表的首地址。 MAP 也可用 " ＾ " 代替。

表达式可以为程序中的标号或数学表达式，基址寄存器为可选项。

当基址寄存器选项不存在时，表达式的值即为内存表的首地址，当该选项存在时，内存表的首地址为表达式的值与基址寄存器的和。

MAP 伪指令通常与 FIELD 伪指令配合使用来定义结构化的内存表。

使用示例：

MAP 0x100 ， R0 ；定义结构化内存表首地址的值为 0x100 ＋ R0 。

FILED

语法格式：

标号 FIELD 表达式

FIELD 伪指令用于定义一个结构化内存表中的数据域。 FILED 也可用 " # " 代替。

表达式的值为当前数据域在内存表中所占的字节数。

FIELD 伪指令常与 MAP 伪指令配合使用来定义结构化的内存表。

MAP 伪指令定义内存表的首地址，FIELD 伪指令定义内存表中的各个数据域，并可以为每个数据域指定一个标号供其他的指令引用。

注意 MAP 和 FIELD 伪指令仅用于定义数据结构，并不实际分配存储单元。

使用示例：

MAP 0x100 ；定义结构化内存表首地址的值为 0x100 。

A FIELD 16 ；定义 A 的长度为 16 字节，位置为 0x100

B FIELD 32 ；定义 B 的长度为 32 字节，位置为 0x110

S FIELD 256 ；定义 S 的长度为 256 字节，位置为 0x130

3、汇编控制（ Assembly Control ）伪指令

汇编控制伪指令用于控制汇编程序的执行流程，常用的汇编控制伪指令包括以下几条：

— IF 、 ELSE 、 ENDIF

— WHILE 、 WEND

— MACRO 、 MEND

— MEXIT

IF、ELSE、ENDIF

　　　　
语法格式：

IF 逻辑表达式

指令序列 1

ELSE

指令序列 2

ENDIF

IF 、 ELSE 、 ENDIF 伪指令能根据条件的成立与否决定是否执行某个指令序列。

当 IF 后面的逻辑表达式为真，则执行指令序列1，否则执行指令序列2。

其中，ELSE及指令序列 2 可以没有，此时，当IF后面的逻辑表达式为真，则执行指令序列1，否则继续执行后面的指令。

IF 、 ELSE 、 ENDIF 伪指令可以嵌套使用。

使用示例：

GBLL Test ；声明一个全局的逻辑变量，变量名为 Test……

IF Test = TRUE

指令序列 1

ELSE

指令序列 2

ENDIF

WHILE、WEND

　　　　
语法格式：

WHILE 逻辑表达式

指令序列

WEND

WHILE 、 WEND 伪指令能根据条件的成立与否决定是否循环执行某个指令序列。

当 WHILE 后面的逻辑表达式为真，则执行指令序列，该指令序列执行完毕后，再判断逻辑表达式的值，若为真则继续执行，一直到逻辑表达式的值为假。

WHILE 、 WEND 伪指令可以嵌套使用。

使用示例：

GBLA Counter ；声明一个全局的数学变量，变量名为 Counter

Counter SETA 3 ；由变量Counter 控制循环次数

WHILE Counter <

指令序列

WEND

MACRO、MEND

　　　　
语法格式：

$ 标号宏名 $ 参数 1 ， $ 参数 2 ，……

指令序列

MEND

MACRO 、 MEND 伪指令可以将一段代码定义为一个整体，称为宏指令，然后就可以在程序中通过宏指令多次调用该段代码。

其中， $ 标号在宏指令被展开时，标号会被替换为用户定义的符号，宏指令可以使用一个或多个参数，当宏指令被展开时，这些参数被相应的值替换。

宏指令的使用方式和功能与子程序有些相似，子程序可以提供模块化的程序设计、节省存储空间并提高运行速度。

但在使用子程序结构时需要保护现场，从而增加了系统的开销，因此，在代码较短且需要传递的参数较多时，可以使用宏指令代替子程序。

包含在 MACRO 和 MEND 之间的指令序列称为宏定义体，在宏定义体的第一行应声明宏的原型（包含宏名、所需的参数），然后就可以在汇编程序中通过宏名来调用该指令序列。在源程序被编译时，汇编器将宏调用展开，用宏定义中的指令序列代替程序中的宏调用，并将实际参数的值传递给宏定义中的形式参数。

MACRO 、 MEND 伪指令可以嵌套使用。

MEXIT

　　　　
语法格式：

MEXIT:

MEXIT 用于从宏定义中跳转出去。

4、其他常用的伪指令

还有一些其他的伪指令，在汇编程序中经常会被使用，包括以下几条：

— AREA

— ALIGN

— CODE16 、 CODE32

— ENTRY

— END

— EQU

— EXPORT （或 GLOBAL ）

— IMPORT

— EXTERN

— GET （或 INCLUDE ）

— INCBIN

— RN

— ROUT

AREA

　　　　
语法格式：

AREA 段名属性 1 ，属性 2 ，……

AREA 伪指令用于定义一个代码段或数据段。其中，段名若以数字开头，则该段名需用 " | " 括起来，如 |1_test| 。

属性字段表示该代码段（或数据段）的相关属性，多个属性用逗号分隔。常用的属性如下：

— CODE 属性：用于定义代码段，默认为 READONLY 。

— DATA 属性：用于定义数据段，默认为 READWRITE 。

— READONLY 属性：指定本段为只读，代码段默认为 READONLY 。

— READWRITE 属性：指定本段为可读可写，数据段的默认属性为 READWRITE 。

— ALIGN 属性：使用方式为 ALIGN 表达式。在默认时， ELF （可执行连接文件）的代码段和数据段是按字对齐的，表达式的取值范围为 0 ～ 31 ，相应的对齐方式为 2 表达式次方。

— COMMON 属性：该属性定义一个通用的段，不包含任何的用户代码和数据。各源文件中同名的 COMMON 段共享同一段存储单元。

一个汇编语言程序至少要包含一个段，当程序太长时，也可以将程序分为多个代码段和数据段。

使用示例：

AREA Init ， CODE ， READONLY

该伪指令定义了一个代码段，段名为 Init ，属性为只读

ALIGN

　　　　
语法格式：

ALIGN { 表达式 { ，偏移量 }}

ALIGN 伪指令可通过添加填充字节的方式，使当前位置满足一定的对其方式。其中，表达式的值用于指定对齐方式，可能的取值为 2 的幂，如 1 、 2 、 4 、 8 、 16 等。若未指定表达式，则将当前位置对齐到下一个字的位置。偏移量也为一个数字表达式，若使用该字段，则当前位置的对齐方式为： 2 的表达式次幂＋偏移量。

使用示例：

AREA Init，CODE，READONLY，ALIEN＝3；指定后面的指令为 8 字节对齐。

指令序列

END

CODE16、CODE32

　　　　
语法格式：

CODE16（或 CODE32）

CODE16 伪指令通知编译器，其后的指令序列为 16 位的 Thumb 指令。

CODE32 伪指令通知编译器，其后的指令序列为 32 位的 ARM 指令。

若在汇编源程序中同时包含 ARM 指令和 Thumb 指令时，可用 CODE16 伪指令通知编译器其后的指令序列为 16 位的 Thumb 指令， CODE32 伪指令通知编译器其后的指令序列为 32 位的 ARM 指令。因此，在使用 ARM 指令和 Thumb 指令混合编程的代码里，可用这两条伪指令进行切换，但注意他们只通知编译器其后指令的类型，并不能对处理器进行状态的切换。

使用示例：

AREA Init ， CODE ， READONLY

……

CODE32 ；通知编译器其后的指令为 32 位的 ARM 指令

LDR R0 ，＝ NEXT ＋ 1 ；将跳转地址放入寄存器 R0

BX R0；程序跳转到新的位置执行，并将处理器切换到 Thumb 工作状态

……

CODE16；通知编译器其后的指令为 16 位的 Thumb 指令

NEXT LDR R3，＝0x3FF

……

END ；程序结束

ENTRY

　　　　
语法格式：

ENTRY

ENTRY 伪指令用于指定汇编程序的入口点。在一个完整的汇编程序中至少要有一个 ENTRY （也可以有多个，当有多个 ENTRY 时，程序的真正入口点由链接器指定），但在一个源文件里最多只能有一个 ENTRY （可以没有）。

使用示例：

AREA Init ， CODE ， READONLY

ENTRY ；指定应用程序的入口点

……

END

　　　　
语法格式：

END

END 伪指令用于通知编译器已经到了源程序的结尾。

使用示例：

AREA Init ， CODE ， READONLY

……

END ；指定应用程序的结尾

EQU

语法格式：

名称 EQU 表达式 { ，类型 }

EQU 伪指令用于为程序中的常量、标号等定义一个等效的字符名称，类似于 C 语言中的＃define 。

其中 EQU 可用" * "代替。

名称为 EQU 伪指令定义的字符名称，当表达式为 32 位的常量时，可以指定表达式的数据类型，可以有以下三种类型：

CODE16 、 CODE32 和 DATA

使用示例：

Test EQU 50 ；定义标号 Test 的值为 50

Addr EQU 0x55 ， CODE32 ；定义 Addr 的值为 0x55 ，且该处为 32 位的 ARM 指令。

EXPORT（或GLOBAL）

　　　　
语法格式：

EXPORT 标号 {[WEAK]}

EXPORT 伪指令用于在程序中声明一个全局的标号，该标号可在其他的文件中引用。 EXPORT可用 GLOBAL 代替。标号在程序中区分大小写， [WEAK] 选项声明其他的同名标号优先于该标号被引用。

使用示例：

AREA Init ， CODE ， READONLY

EXPORT Stest ；声明一个可全局引用的标号Stest……

END

IMPORT

　　　　
语法格式：

IMPORT 标号 {[WEAK]}

IMPORT 伪指令用于通知编译器要使用的标号在其他的源文件中定义，但要在当前源文件中引用，而且无论当前源文件是否引用该标号，该标号均会被加入到当前源文件的符号表中。

标号在程序中区分大小写， [WEAK] 选项表示当所有的源文件都没有定义这样一个标号时，编译器也不给出错误信息，在多数情况下将该标号置为 0 ，若该标号为 B 或 BL 指令引用，则将 B 或 BL指令置为 NOP 操作。

使用示例：

AREA Init ， CODE ， READONLY

IMPORT Main ；通知编译器当前文件要引用标号Main，但Main 在其他源文件中定义……

END

EXTERN

　　　　
语法格式：

EXTERN 标号 {[WEAK]}

EXTERN 伪指令用于通知编译器要使用的标号在其他的源文件中定义，但要在当前源文件中引用，如果当前源文件实际并未引用该标号，该标号就不会被加入到当前源文件的符号表中。

使用示例：

AREA Init ， CODE ， READONLY

EXTERN Main ；通知编译器当前文件要引用标号Main，但Main 在其他源文件中定义……

END

GET（或INCLUDE）

　　　　
语法格式：

GET 文件名

GET 伪指令用于将一个源文件包含到当前的源文件中，并将被包含的源文件在当前位置进行汇编处理。可以使用 INCLUDE 代替 GET 。

汇编程序中常用的方法是在某源文件中定义一些宏指令，用 EQU 定义常量的符号名称，用 MAP和 FIELD 定义结构化的数据类型，然后用 GET 伪指令将这个源文件包含到其他的源文件中。使用方法与 C 语言中的 " include " 相似。

GET 伪指令只能用于包含源文件，包含目标文件需要使用 INCBIN 伪指令

使用示例：

AREA Init ， CODE ， READONLY；

GET a1.s ；通知编译器当前源文件包含源文件a1.s；

通知编译器当前源文件包含源文件C：/ a2.s ……

END

INCBIN

　　　　
语法格式：

INCBIN 文件名

INCBIN 伪指令用于将一个目标文件或数据文件包含到当前的源文件中，被包含的文件不作任何变动的存放在当前文件中，编译器从其后开始继续处理。

使用示例：

AREA Init ， CODE ， READONLY INCBIN a1.dat ；通知编译器当前源文件包含文件a1.dat

INCBIN C：/a2.txt ；通知编译器当前源文件包含文件C：/a2.txt……

END

　　　　
语法格式：

名称 RN 表达式:

RN 伪指令用于给一个寄存器定义一个别名。采用这种方式可以方便程序员记忆该寄存器的功能。其中，名称为给寄存器定义的别名，表达式为寄存器的编码。

使用示例：

Temp RN R0 ；将R0 定义一个别名Temp

ROUT

　　　　
语法格式：

{ 名称 } ROUT

ROUT 伪指令用于给一个局部变量定义作用范围。在程序中未使用该伪指令时，局部变量的作用范围为所在的 AREA ，而使用 ROUT 后，局部变量的作为范围为当前ROUT 和下一个 ROUT 之间。

（直接点击图片可进入调查页面）

围观 869

ARM汇编伪指令

伪操作、宏指令及伪指令的概念

伪操作是ARM汇编语言程序里的一些特殊指令助记符，主要是为完成汇编程序做各种准备工作，在源程序进行汇编时由汇编程序处理，而不是在处理器运行期间由机器执行。

宏指令是一段独立的程序代码，它通过伪操作来定义。通过宏名来调用宏，并可以设置相应的参数。宏定义本身不会产生代码，只是在调用它时把宏体插入到源程序中。

伪指令也是ARM汇编语言程序里的特殊指令助记符，也不在处理器运行期间由机器执行，它们在汇编时将被合适的机器指令代替成ARM或Thumb指令从而实现真正指令操作。

伪操作

符号定义（Symbol Definition）伪操作

内存分配（数据定义）（Data Definition）伪操作

汇编控制（Assembly Control）伪操作

其他（Miscellaneous）伪操作

点击下载

围观 251

在嵌入式系统开发中，目前使用的主要编程语言是C 和汇编，虽然C++已经有相应的编译器，但是现在使用还是比较少的。

在稍大规模的嵌入式程序设计中，大部分的代码都是用C来编写的，主要是因为C语言具有较强的结构性，便于人的理解，并且具有大量的库支持。但对于一写硬件上的操作，很多地方还是要用到汇编语言，例如硬件系统的初始化中的CPU 状态的设定，中断的使能，主频的设定，RAM控制参数等。另外在一些对性能非常敏感的代码块，基于汇编与机器码一一对应的关系，这时不能依靠C编译器的生成代码，而要手工编写汇编，从而达到优化的目的。汇编语言是和CPU的指令集紧密相连的，作为涉及底层的嵌入式系统开发，熟练对应汇编语言的使用也是必须的。

单纯的C或者汇编编程请参考相关的书籍或者手册，这里主要讨论C和汇编的混合编程，包括相互之间的函数调用。下面分四种情况来进行讨论，不涉及C++语言。

一、在C语言中内嵌汇编

在C中内嵌的汇编指令包含大部分的ARM和Thumb指令，不过使用与单纯的汇编程序使用的指令略有不同，存在一些限制，主要有下面几个方面：

a 不能直接向PC 寄存器赋值，程序跳转要使用B或者BL指令；

b 在使用物理寄存器时，不要使用过于复杂的C表达式，避免物理寄存器冲突；

c R12和R13可能被编译器用来存放中间编译结果，计算表达式值时可能把R0-R3、R12及R14用于子程序调用，因此避免直接使用这些物理寄存器；

d 一般不要直接指定物理寄存器；

e 让编译器进行分配内嵌汇编使用的标记是__asm或asm关键字，用法如下：__asm{instruction [; instruction]}或 asm("instruction [; instruction]")。

下面是一个例子来说明如何在C中内嵌汇编语言：

//C语言文件*.
#include
void my_strcpy(const char *src, char *dest){
char ch;
__asm{
loop:
ldrb ch, [src], #1
strb ch, [dest], #1
cmp ch, #0
bne loop
}
}
int main(){
char *a="forget it and move on!";
char b[64];
my_strcpy(a, b);
printf("original: %s", a);
printf("copyed: %s", b);
return 0;
}

在此例子中C语言和汇编之间的值传递是用C语言的指针来实现的，因为指针对应的是地址，所以汇编中也可以访问。

二、在汇编中使用C定义的全局变量

内嵌汇编不用单独编辑汇编语言文件，比较简洁，但是有很多的限制。当汇编的代码较多时一般放在单独的汇编文件中，这时就需要在汇编文件和C文件之间进行一些数据的传递，最简便的办法就是使用全局变量。

下面是一个C语言和汇编语言共享全局变量的例子：

//C语言文件*.

#include
int gVar=12;
extern asmDouble(void);
int main(){
printf("original value of gVar is: %d", gVar_1);
asmDouble();
printf(" modified value of gVar is: %d", gVar_1);
return 0;
}

;汇编语言文件*.

AREA asmfile, CODE, READONLY EXPORT asmDouble
IMPORT gVar
asmDouble
ldr r0, =gVar
ldr r1, [r0]
mov r2, #2
mul r3, r1, r2
str r3, [r0]
mov pc, lr
END

在此例中，汇编文件与C文件之间相互传递了全局变量gVar和函数asmDouble，留意声明的关键字extern和IMPORT

三、在C中调用汇编的函数

有一些对机器要求高的敏感函数，通过C语言编写再通过C编译器翻译有时会出现误差，因此这样的函数一般采用汇编语言来编写，然后供C语言调用。在C文件中调用汇编文件中的函数，要注意的有两点，一是要在C文件中声明所调用的汇编函数原型，并加入extern关键字作为引入函数的声明；二是在汇编文件中对对应的汇编代码段标识用EXPORT关键字作为导出函数的声明，函数通过mov pc, lr指令返回。这样，就可以在C文件中使用该函数了。从C语言的角度的角度，并不知道调用的函数的实现是用C语言还是汇编汇编语言，原因C语言的函数名起到表明函数代码起始地址的作用，而这个作用和汇编语言的代码段标识符是一致的。

下面是一个C语言调用汇编函数例子：

//C语言文件*.

#include
extern void asm_strcpy(const char *src, char *dest);
int main(){
const char *s="seasons in the sun"; char d[32];
asm_strcpy(s, d);
printf("source: %s", s);
printf(" destination: %s",d);
return 0;
}

;汇编语言文件*.

AREA asmfile, CODE, READONLY
EXPORT asm_strcpy
asm_strcpy
loop
ldrb r4, [r0], #1
cmp r4, #0
beq over
strb r4, [r1], #1
b loop
over
mov pc, lr
END

在此例中，C语言和汇编语言之间的参数传递是通过对应的用R0-R3来进行传递，即R0传递第一个参数，R1传递第二个参数，多于4个时借助栈完成，函数的返回值通过R0来传递。这个规定叫作ATPCS（ARM Thumb Procedure Call Standard），具体见ATPCS规范。

四、在汇编中调用C的函数

在汇编语言中调用C语言的函数，需要在汇编中IMPORT对应的C函数名，然后将C的代码放在一个独立的C文件中进行编译，剩下的工作由连接器来处理。

下面是一个汇编语言调用C语言函数例子：

//C语言文件*.

int cFun(int a, int b, int c){
return a+b+c;
}
;汇编语言文件*.

AREA asmfile, CODE, READONLY
EXPORT cFun
start
mov r0, #0x1
mov r1, #0x2
mov r2, #0x3
bl cFun
nop
nop
b start
END

在汇编语言中调用C语言的函数，参数的传递也是按照ATPCS规范来实现的。

在这里简单介绍一下部分ATPCS规范：

子程序间通过寄存器R0～R3来传递参数。

A.在子程序中，使用寄存器R4～R11来保存局部变量。

B.寄存器R12用于子程序间scratch寄存器(用于保存SP，在函数返回时使用该寄存器出桟），记作IP。

C.寄存器R13用于数据栈指针，记作SP。寄存器SP在进入子程序时的值和退出子程序时的值必须相等。

D.寄存器R14称为链接寄存器，记作LR。它用于保存子程序的返回地址。

E.寄存器R15是程序计数器，记作PC

F.参数不超过4个时，可以使用寄存器R0～R3来传递参数，当参数超过4个时，还可以使用数据栈来传递参数。

G.结果为一个32位整数时，可以通过寄存器R0返回

H.结果为一个64位整数时，可以通过寄存器R0和R1返回，依次类推。

以上通过几个简单的例子演示了嵌入式开发中常用的C 和汇编混合编程的一些方法和基本的思路，其实最核心的问题就是如何在C 和汇编之间传值，剩下的问题就是各自用自己的方式来进行处理。以上只是抛砖引玉，更详细和复杂的使用方法要结合实际应用并参考相关的资料。

围观 901

MCU加油站

汇编语言

本土热门MCU

热门话题

应用

热门产品

关键技术

近期产品推荐

近期活动

微信公众号