1.什么是CLR
CLR(Common Language Runtime)公共语言运行时,是一个可由多种编程语言使用的“运行时”。CLR的核心功能(比如内存管理、程序集加载、安全性、异常处理和线程同步)可由面向CLR的所有语言使用。CLR不关心开发人员使用哪种语言进行编程,只要编译器面向CLR就可以了,所有,开发人员应该使用自己最适合和熟悉的语言进行编程。所有的编程语言在面向CLR编译器的编译都生成了一个托管模块。托管模块是一个标准的32位的Microsoft Windows可移植执行体(PE32)文件,或者是一个标准的64位Windows可移植的PE32+文件,他们都需要CLR才能执行。
2.托管模块的各个组成部分
PE32或PE32+头 标准Windows PE文件头,类似于“公共对象文件格式”。
CLR头 包含使用这个模块成为一个托管模块的信息(可由CLR和一些实用程序进行解释)。头中包含了需要的CLR版本,一些标志,托管模块人口方法(Main方法)的MethodDef元数据标记(token),以及模块的元数据、资源、强名称、一些flag以及其他不太重要的数据项的位置/大小
元数据 每个托管模块都包含元数据表。主要有两种类型的表:一种类型的表描述源代码中定义的类型和成员:另一种类型的表描述源代码引用类型和成员
IL(中间语言)代码 编译器编译源代码时生成的代码。在运行时,CLR将将IL编译成本地的CPU指令
元数据的用途:
编译时,元数据消除了对本地C/C++头和库文件的需求,因为在负责实现类型/成员的IL代码中,已包和引用的类型/成员有关的全部信息。编译器可直接从托管模块读取元数据
Microsoft Visual Studio 使用元数据帮助你写代码。也就是“智能感知(IntelliSense)技术”可以解析元数据,指出一个类型提供了那些方法、属性、事件和字段等等。
CLR的代码验证过程使用元数据确保代码只执行“类型安全”的操作。
元数据允许将一个对象的字段序列化到一个内存中,将其发送给另一台机器,然后反序列化,在远程机器上重建对象的状态
元数据允许垃圾回收器跟踪对象的生存期。垃圾回收器能判断任何对象的类型,并从元数据知道那个对象中的哪些字段引用了其他对象。
3.程序集
其实,CLR不和托管模块一起工作。它和程序集(assembly)一块工作。程序集是一个或多个模块/资源文件的逻辑分组。程序集是重用、安全性已经版本控制的最小单元。程序集是自描述的(self-describing)
4 执行程序集的代码
托管程序集同时包含元数据和IL。为了执行程序,首先必须把它的IL转换成本地CPU指令。这是CLR的JIT(just-in-time)编译器的职责。
下面我将复述一下一个书的例子来说明一个程序集中的代码是如何执行的。
在Main方法执行之前,CLR会检测出Main的代码引用的所有类型。这将导致CLR分配一个内部数据结构,它用来管理对所用引用的类型的访问。例如上图,Main方法引用了一Console类型,这导致CLR分配一个内部结构。在这个内部结构中,Console类型定义的每个方法都有一个对应的记录项。每个记录项都容纳一个地址,根据此地址既可以找到方法的实现。对这个结构进行初始时,CLR将每个记录项都设置成(指向)包含在CLR内部的一个未文档化的函数。我将这个函数成为JITCompiler。
Main首次调用WriteLine时,JITCompiler函数会被调用。JITCompiler函数负责将一个方法IL代码编译成本地CPU指令。由于IL是“即时”(just in time)编译的,所以通常CLR的这个组件称为JITter或者JIT编译器。
JITCompiler函数被调用时,它知道要调用的是哪个方法,以及具体是什么类型定义了该方法。然后,JITCompiler会在定义程序集的元数据中查找被调用的方法的IL。接着,JITCompiler验证IL代码,并将IL代码编译成本地CPU指令。本地CPU指令被保存到一个动态分配的内存块中。然后,JITCompiler返回CLR为类型创建的内部数据结构,找到与被调用的方法对象的那一条记录,修改最初对JITCompiler的引用,让它现在指向内存块中的地址。最后,JITCompiler函数跳转到内存块中的代码。
第二次调用WriteLine。这一次,由于对WriteLine的代码进行了验证和编译,所以直接执行内存块中的代码,完全跳过JITCompiler函数。
第二次调用WriteLine的情况
5.通用类型系统
为了通过类型,用一种编程语言写的代码能与用另一种语言写的代码沟通,Microsoft指定了一正式的规范,即“通用类型系统”(Common Type System,CTS),它描述了类型的定义和行为。
CTS规范规定,一个类型可以包含零个或多个成员。
字段(Field) 一个数据变量
方法(Method) 一个函数
属性(Property) 对于调用者,该成员看起来像是一个字段
事件(Event) 事件在对象以及其他相关对象之间实现了一通用机制。
CTS 还指定了类型可视性规则以及类型成员的访问规则,例如private,family等
CTS还为类型继承。虚方法、对象生存期等定义了相应的规则
特比说一下CTS中的一条规则:所有类型最终必须从预定义的System.Object类型继承。System.Object可以做的事情如下:
比较两个实例的相等性
获取实例的哈希码
查询一个实例的真正类型
执行实例的浅拷贝
获取视实例对象的当前状态的一个字符串表示
6.公共语言规范
为了创建很容易从其他编程语言中访问的类型,只能从自己的编程语言中挑选其他所有语言都确定支持的那些功能,Microsoft定义了一个“公共语言规范”(Common Language Specifiaction,CLS),它详细定义了一个最小功能集。
7.元数据
上面已经提到托管的PE文件由4个部分构成:PE32(+)头、CLR头、元数据以及IL。
这里我们主要说一下元数据。
元数据是一个二进制数据块,由几个表构成。这些表分为三个类别:定义表(definiton talbe)、引用表(reference table)和清单表(mainfest table)。
常用元数据定义表(编译器编译源代码时,代码定义的任何一样东西都会导致定义表中的表中创建一个记录项):
ModuleDef 总是包含一个用于标示模块的记录项。
TypeDef 模块中定义的每个类型都在这个定义表中有一个对应的记录项。
MethodDef 模块中定义的每个方法都在这个定义表中有一个对应的记录项。
FieldDef 模块中定义的每个字段都在这个定义表中有一个对应的记录项
ParamDef 模块中定义的每个参数都在这个定义表中有一个对应的记录项
PropertyDef 模块中定义的每个属性都在这个定义表中有一个对应的记录项
EventDef 模块中定义的每个事件都在这个定义表中有一个对应的记录项
常用的引用元数据表:
AssemblyRef 模块中引用的每个程序集在这个表中都有一个对应的记录项
ModuleRef 模块引用的每个类型可能是由别的PE模块实现的,所有那些模块在这个表都有一个记录项
TypeDef 模块引用的每个类型在这个表中都有一个对应的记录项
MemberRef 模块引用的每个成员都在这个表中有一个对应的记录项
清单元数据表:
AssemblyDef 如果该模块标示的是一个程序集,就在这个元数据表中包含单个记录项。该记录项列出了程序集名称(不含路径和扩展名)、版本(major,minor,build和revision)、语言文化(culture)、一些标志(flag)、哈希算法以及发布者的公钥。
FileDef 作为程序集一部分的每个PE文件和资源文件在这个表中都有一个对应的记录项。
MainifestResourceDef 作为程序集一部分的每个资源在这个表中都有一个对应的记录项
ExportedTypesDef 从程序集的所有PE模块中导出的每个public类型中在这个表中都有一个对应的记录项。