ORM原理

对象关系映射 (Object Relational Mapping ,简称ORM )是一种为了解决面向对象 与关系数据库 存在的互不匹配的现象的技术。简单的说,ORM是通过使用描述对象 和数据库之间映射的元数据 ,将java程序 中的对象自动持久化到关系数据库中。本质上就是将数据从一种形式转换到另外一种形式。这也同时暗示者额外的执行开销;然而,如果ORM作为一种中间件 实现,则会有很多机会做优化,而这些在手写的持久层并不存在。更重要的是用于控制转换的元数据需要提供和管理;但是同样,这些花费要比维护手写的方案要少;而且就算是遵守ODMG规范的对象数据库依然需要类 级别的元数据。

      对象-关系映射 (Object /RelationMapping,简称ORM),是随着面向对象的软件开发 方法发展而产生的。面向对象的开发方法是当今企业级应用开发环境中的主流开发方法,关系数据库是企业级应用环境中永久存放数据的主流数据存储系统。对象和关系数据是业务实体 的两种表现形式,业务实体在内存中表现为对象,在数据库中表现为关系数据。内存中的对象之间存在关联和继承关系,而在数据库中,关系数据无法直接表达多对多关联和继承关系。因此,对象-关系映射(ORM)系统一般以中间件的形式存在,主要实现程序对象到关系数据库数据的映射。

     面向对象是从软件工程 基本原则(如耦合、聚合、封装)的基础上发展起来的,而关系数据库则是从数学理论发展而来的,两套理论存在显著的区别。为了解决这个不匹配的现象,对象关系映射技术应运而生。

     让我们从O/R开始。字母O起源于"对象"(Object),而R则来自于"关系"(Relational)。几乎所有的程序里面,都存在对象和关系数据库。在业务逻辑层和用户界面层 中,我们是面向对象的。当对象信息发生变化的时候,我们需要把对象的信息保存在关系数据库中。

     当你开发一个应用程序的时候(不使用O/RMapping),你可能会写不少数据访问层的代码,用来从数据库保存,删除,读取对象信息,等等。你在DAL中写了很多的方法来读取对象数据,改变状态对象等等任务。而这些代码写起来总是重复的。    如果打开你最近的程序,看看DAL代码,你肯定会看到很多近似的通用的模式 。我们以保存对象的方法为例,你传入一个对象,为SqlCommand对象添加SqlParameter,把所有属性和对象对应,设置SqlCommand的CommandText属性为存储过程,然后运行SqlCommand。对于每个对象都要重复的写这些代码。

  除此之外,还有更好的办法吗?有,引入一个O/RMapping。实质上,一个O/RMapping会为你生成DAL。与其自己写DAL代码,不如用O/RMapping。你用O/RMapping保存,删除,读取对象,O/RMapping负责生成SQL,你只需要关心对象就好。

     对象关系映射成功运用在不同的面向对象持久层产品中,如:Torque,OJB,Hibernate,TopLink,Castor JDO ,TJDO等。

     一般的ORM包括以下四部分:        一个对持久类对象进行CRUD操作的API ;        一个语言或API用来规定与类和类属性相关的查询;        一个规定mappingmetadata的工具;        一种技术可以让ORM的实现同事务对象一起进行dirtychecking, lazy association fetching以及其他的优化操作。

一、目前流行的ORM产品

     目前众多厂商和开源 社区都提供了持久层框架 的实现,常见的有:

    

Apache OJB (http://db .apache.org/ojb/) 
       Cayenne (http://objectstyle.org/cayenne/) 
       Jaxor (http://jaxor.sourceforge.net) 
       Hibernate (http://www.hibernate.org) 
       iBatis (http://www.ibatis.com) 
       jRelationalFramework (http://ijf.sourceforge.net) 
       mirage (http://itor.cq2.org/en/oss/mirage/toon) 
       SMYLE (http://www.drjava.de/smyle) 
       TopLink (http://otn.oracle .com/products/ias/toplink/index.html)

     其中TopLink是Oracle的商业产品,其他均为开源项目。

     其中Hibernate的轻量级ORM模型逐步确立了在Java ORM 架构 中领导地位,甚至取代复杂而又繁琐的EJB 模型而成为事实上的 JavaORM 工业标准。而且其中的许多设计均被 J2EE 标准组织吸纳而成为最新 EJB3.0 规范的标准,这也是开源项目影响工业领域标准的有力见证。

二、对象-关系映射模式

     从《公共仓库元模型:开发指南》一书第8章CWM元仓库中摘录出来的内容,实现了公共仓库元模型(CWM)的UML 图到Microsoft SQL Server 数据库的映射,是一种将对象层次结构映射成关系型结构的方法。个人认为可以作为将本体(Ontology )文件 存储到关系型数据库中的一种可借鉴方法。

     基本情况:公共仓库元模型(CWM)是对象管理组织(OMG)的一种和数据仓库 相关的元模型标准,采用UML表示的对象层次结构,在保存到数据库中时由于面向对象的数据库技术的不完善(理论研究和商业应用都不是主流),所以该书的作者倾向于使用成熟的关系型数据库来保存-这也是存储本体时所遇到的问题。

     采用方法:将UML模型中的各种元素通过转换,保存为数据库模式。由于CWM是一种元模型,因此模型的实例也是一种模型,将这种实例以数据库数据的形式保存。使用数据库中比较成熟的存储过程技术提高开发和执行效率。

     1、数据类型 映射模式

     1.1简单数据类型模式:建立UML和关系型数据库中简单数据类型的映射表以指导映射。       1.2枚举数据类型模式:每种枚举类型对应一个表,只有一个列(_EnumLiteral)表示枚举值。       1.3基于类的数据类型模式:使用外键约束,将基础列与基于类的类型实例相关联。

     2、类映射模型

     每个类对应一个表。单值属性、多值属性、继承关系可以用下述方法映射,而引用属性将在关联映射模式中提到。

     2.1单值属性模式:是cardinality的上界为1的属性,映射到类所对应的表的列上。若其下界也为1(必须有的属性),列属性为NOTNULL。       2.2多值属性模式:每个多值属性映射成一个独立的表,使用外键连接到类所对应的表上。       2.3继承模式:每加入一个类的实例时,根据其继承关系自顶向下生成每个类的对象,这些对象具有相同的ID(根对象对应记录的主键)。删除对象实例时,自底向上删除数据。遇到从中间删的情况怎么办?多重继承怎么处理?(金龙飞)

      3、关联映射模式

     3.1一对一关联模式:在关联两端各加一列。       3.2一对多关联模式:和3.1一样。如果多这端是有序的,还需加入一列表示序号。       3.3多对多关联模式:将关联单独作一个表。       3.4组合关联模式:注意级联式删除。       3.5反演关联模式:关联两端指向相关的类型,和普通关联一样。       3.6成对关联模式:关联记录两个类间的关系,用交集类表示关联,表示成一个单独的表,每个关联对应一个表,用外键表示它们间的关系。       3.7关联上的OCL需要分析成对应的存储过程代码。       3.8保证关联的cardinality也需要分析成对应的存储过程代码。

     4、引用映射模式

      在UML中不存在的MOF特征,指属性是声明为引用类型的实例。用存储过程实现。

表关系(一对一,一对多,多对对)

 

目录(?)[-]

1.    定义表关系

1.    一对多关系

2.    多对多关系

3.    一对一关系

2.    实施参照完整性

可以在数据库图表中的表之间创建关系,以显示一个表中的列与另一个表中的列是如何相链接的。

在一个关系型数据库中,利用关系可以避免多余的数据。例如,如果设计一个可以跟踪图书信息的数据库,您需要创建一个名为 titles 的表,它用来存储有关每本书的信息,例如书名、出版日期和出版社。您也可能保存有关出版社的信息,诸如出版社的电话、地址和邮政编码。如果您打算在 titles 表中保存所有这些信息,那么对于某出版社出版的每本书都会重复该出版社的电话号码。

更好的方法是将有关出版社的信息在单独的表,publishers,中只保存一次。然后可以在 titles 表中放置一个引用出版社表中某项的指针。

为了确保您的数据同步,可以实施 titles 和 publishers 之间的参照完整性。参照完整性关系可以帮助确保一个表中的信息与另一个表中的信息相匹配。例如,titles 表中的每个书名必须与 publishers 表中的一个特定出版社相关。如果在数据库中没有一个出版社的信息,那么该出版社的书名也不能添加到这个数据库中。

为了更好地理解表关系,请参阅:

  • 定义表关系
  • 实施参照完整性

定义表关系

关系的确立需要通过匹配键列中的数据(通常是两表中同名的列)。在大多数情况下,该关系会将一个表中的主键(它为每行提供了唯一标识)与另一个表的外部键中的某项相匹配。例如,通过创建 titles 表中的 title_id(主键)与 sales 表中的 title_id 列(外部键)之间的关系,则销售额就与售出的特定书名相关联了。

表之间有三种关系。所创建关系的类型取决于相关列是如何定义的。

  • 一对多关系
  • 多对多关系
  • 一对一关系

一对多关系

一对多关系是最普通的一种关系。在这种关系中,A表中的一行可以匹配B表中的多行,但是B表中的一行只能匹配A 表中的一行。例如,publishers 和 titles 表之间具有一对多关系:每个出版社出版很多书,但是每本书名只能出自一个出版社。

只有当一个相关列是一个主键或具有唯一约束时,才能创建一对多关系。

多对多关系

在多对多关系中,A表中的一行可以匹配 B表中的多行,反之亦然。要创建这种关系,需要定义第三个表,称为结合表,它的主键由 A表和 B 表的外部键组成。例如,authors 和 titles 表具有多对多关系,这是由于这些表都与titleauthors 表具有一对多关系。titleauthors 表的主键是 au_id 列(authors 表的主键)和 title_id 列(titles 表的主键)的组合。

一对一关系

在一对一关系中,A表中的一行最多只能匹配于 B表中的一行,反之亦然。如果相关列都是主键或都具有唯一约束,则可以创建一对一关系。

这种关系并不常见,因为一般来说,按照这种方式相关的信息都在一个表中。可以利用一对一关系来:

  • 分割具有多列的表。
  • 由于安全原因而隔离表的一部分。
  • 保存临时的数据,并且可以毫不费力地通过删除该表而删除这些数据。
  • 保存只适用于主表的子集的信息。

实施参照完整性

参照完整性是一个规则系统,能确保相关表行之间关系的有效性,并且确保不会在无意之中删除或更改相关数据。

当实施参照完整性时,必须遵守以下规则:

  • 如果在相关表的主键中没有某个值,则不能在相关表的外部键列中输入该值。但是,可以在外部键列中输入一个 null 值。例如,不能将一项工作分配给一位没有包含在 employee 表中的雇员,但是可以在 employee 表的 job_id 列中输入一个 null 值,表明一位雇员没有分配工作。
  • 如果某行在相关表中存在相匹配的行,则不能从一个主键表中删除该行。例如,如果在 employee 表中表明某些雇员分配了某项工作,则不能在 jobs 表中删除该工作所对应的行。
  • 如果主键表的行具有相关行,则不能更改主键表中的某个键的值。例如,如果一位雇员分配了 jobs 表中的某项工作,则不能从 employee 表中删除该雇员。

当符合下列所有条件时,才可以设置参照完整性:

  • 主表中的匹配列是一个主键或者具有唯一约束。
  • 相关列具有相同的数据类型和大小。
  • 两个表属于相同的数据库。