内容总结:
语义分析
语义分析的任务
1、审查每一个语法结构的静态语义,即验证语法正确的结构是否有意义。
如:赋值语句:x:=x+y,左边变量类型与右边变量类型是否一致。
2.在语义正确的基础上生成一种中间代码或目标代码
语义分析的范围
1.确定类型:确定标识符所关联的数据类型。
2.类型检查:按语言的类型规则,检查运算的合法性与运算分量类型的一致性,必要时作类型转换。
3.识别含义:根据语言的语义定义(形式或非形式),识别程序中各构造成分组合到一起的含义,并作相应的语义处理(生成中间代或目标代码)。
4.控制流检查:控制流语句必须转移到合法的地方。如C中,break语句规定跳出最内层的循环或switch语句。
5.一致性检查:在很多场合要求对象只能被说明一次。如:pascal语言规定同一个标识符在一个分程序中只能被说明一次等。
6.相关名字检查:如:Ada,循环或块可以有一个名字,它出现在这些结构的开头或结尾。编译程序必须检查这两个地方用的名字是否相同。
其它:如名字的作用域分析等也是语义分析的工作。
语义分析方法
根据描述属性文法的语义规则的方式不同分为:语法制导定义,翻译方案。
语法制导翻译:
所谓语法制导翻译是指:对文法中的每个产生式都附加上一个语义动作或语义子程序。伴随着语法分析,每当使用一条产生式进行推导或归约时,就执行相应产生式的语义动作(包括:查填表格,改变变量的求值,诊察与报告错误,生成中间代码等),从而完成预定的翻译工作。
无循环有向图(DAG)
DAG与抽象语法树基本上一样,对表达式中的每个子表达式,DAG中都有一个结点。一个内部结点表示一个操作符,它的孩子表示操作数。
中间代码生成
把经过语法分析和语义分析而获得的源程序中间表示翻译为中间代码表示。
方法:语法制导翻译
采用独立于机器的中间代码的好处:
1. 便于编译系统建立和编译系统的移植;
2. 便于进行独立于机器的代码优化工作。
三元式
三元式由三个部分组成:
算符:OP
第一运算分量:ARG1
第二运算分量:ARG2
几个用到的量:
(1)E.place表示存放E值的名字。
(2)E.code表示对E求值的三地址语句序列。
(3) newtemp是个函数,对它的调用将产生 一个新的临时变量。
间接三元式
在三元式的基础上附加一张指示器表─间接码表,按运算的先后顺序列出有关三元式在三元式表中的位置。这种表示方法称为间接三元式。
四元式:一个四元式是一个带有四个域的记录结构:op,arg1,arg2及result。它实际上就是一条三地址的指令。
数组元素的地址计算公式
若数组A的元素存放在一片连续单元里,则可以较容易的访问数组的每个元素。假定数组的每个元素的宽度为w,则一维数组A[i]这个元素的起始地址为:
base +(i – low)*w
其中,low为数组下标的下界, base是分配给数组的相对地址,即base为A的第一个元素A[low]的相对地址。
base +(i – low)*w 可整理为: i*w+ (base–low*w)
其中:
(1) i*w 是随数组下标变量而变化的部分,记为VARPART ;
(2)(base – low*w)是在数组中不变化的常数记为CONSPART
对于语句a:=b*-c+b*-c 的三地址语句的四元式表示:
(- , c , , t1)
(* , b , t1 , t2)
(- , c , , t3)
(* , b , t1 , t4)
(+ ,t2 , t4 , t5)
(= , t5 , ,a)
过程调用的翻译
1. 过程调用主要解决两个问题:
(1)把程序控制转移到子程序(过程段),执行完毕再返回。这个问题很好解决。
(2)传递实在参数。我们前面谈到过几种不同的参数传递方式(传名、传值、传地址),它们的语义动作也就有所区别。