1、一个源程序从写出到最终执行的过程。
1)编写汇编源程序
2)对源程序进行编译连接
使用汇编语言编译程序对源程序文件中的源程序进行编译,生成目标文件;再用连接程序对目标文件进行连接,生成可在操作系统中直接运行的可执行文件。
可执行文件包含两部分内容
- 程序(从源程序中的汇编指令翻译过来的机器码)和数据(源程序中定义的数据)
- 相关的描述信息(比如程序有多大、要占用多少内存空间等)
3)执行可执行文件
操作系统依照可执行文件中的描述信息,将可执行文件中的机器码和数据载入内存,并进行相关的初始化(比如设置CS:IP指向第一条要执行的指令), 然后由CPU执行程序。
2、汇编源程序
assume cs:codesg
codesg segment
mov ax,0123H
mov bx,0456H
add ax,bx
add ax,ax
mov ax,4c00H
int 21H
codeseg ends
end
1)伪指令
伪指令没有对应的机器指令,最终不被CPU所执行。伪指令是由编译器来执行的指令,编译器根据伪指令来进行相关的编译工作。
上面程序中有3种伪指令。
- 段名 segment
段名 ends
segment和ends是一对成对使用的伪指令,这是在写可被编译器编译的汇编程序时必须要用到的一对伪指令。
segment和ends的功能时定义一个段,segment说明一个段开始,ends说明一个段结束。
一个汇编程序是由多个段组成的,这些段被用来存放代码、数据或当作栈空间来使用。
一个有意义的汇编程序中至少要有一个段,这个段用来存放代码。
- end
end是一个汇编程序的结束标志,编译器在编译汇编程序的过程中,如果碰到了伪指令end,就结束对源程序的编译。
- assume
这条伪指令的含义为"假设"。它假设某一段寄存器和程序中的某一个用segment...ends定义的段相关联。
我们在编程时,记着用assume将有特定用途的段和相关的段寄存去关联起来即可。
2)标号
汇编源程序中,除了汇编指令和伪指令外,还有一些标号,例如"codesg"。一个标号指代了一个地址。比如codesg在segment的前面,作为一个段的名称,这个段的名称最终将被编译、连接程序处理为一个段的段地址。
3)程序返回
一个程序P2在可执行文件中,则必须有一个正在运行的程序P1,将P2从可执行文件加载入内存后,将CPU的控制权交给P2,P2才能得以运行。P2开始运行后,P1暂停运行。
而当P2运行完毕后,应该将CPU的控制权交还给使它得以运行的程序P1,此后P1继续运行。
mov ax,4c00H
int 21H
这两条指令所实现的功能就是程序返回。在程序结束后,将CPU的控制权交还给使它得以运行的程序。
3、编译连接
(注意,如果是使用mac,要记得mac上文件夹分隔符为/,而windows的分隔符是\,所以这里要使用\)
使用masm5编译器进行编译
编译命令:masm,编译后生成目标文件.obj
连接命令:link
连接的作用是什么呢?
- 当源程序很大时,可以将它分为多个源程序文件来编译,每个源程序编译成为目标文件后,再用连接程序将它们连接在一起,生成一个可执行文件
- 程序中调用了某个库文件中的子程序,需要将这个库文件和该程序生成的目标文件连接到一起,生成一个可执行文件
- 一个源程序编译后,得到了存有机器码的目标文件,目标文件中的有些内容还不能直接用来生成可执行文件,连接程序将这些内容处理为最终的可执行信息。所以,在只有一个源程序文件,而又不需要调用某个库中的子程序的情况下,也必须用连接程序对目标文件进行处理,生成可执行文件。
4、Debug
命令:debug 1.exe --1.exe是可执行文件名
DOS系统中exe文件的加载过程如下图所示。
程序装载后,ds中存放着程序所在内存区的段地址,这个内存区的偏移地址为0,则程序所在的内存区的地址为ds:0;
这个内存区的前256个字节中存放的是PSP,DOS用来和程序进行通信。从256字节处向后的空间存放的是程序。