优化总结
要想优化 Hibernate ,我们必须知道应该从什么地方进行优化,从什么地方入手 。Hibernate的优化方向:
- 数据库设计调整
- HQL优化
- API的正确使用(如根据不同的业务类型选用不同的集合及查询API)
- 主配置参数(日志,查询缓存,fetch_size, batch_size等)
- 映射文件优化(ID生成策略,二级缓存,延迟加载,关联优化)
- 一级缓存的管理
- 针对二级缓存,还有许多特有的策略
- 事务控制策略。
具体分析
第一点:数据库设计调整
前边博客介绍过数据库设计,今天我们还从这开始,表的设计就是建楼的基础,如何让基础简洁而结实这是最重要的。
优化策略:
1.建索引
2.减少表之间的关联
3.简化查询字段,没用的字段不要,已经对返回结果的控制,尽量返回少量数据
4.适当的冗余数据,不过分最求高范式
5.尽量不使用联合主键
6. ID的生成机制,不同的数据库所提供的机制并不完全一样
第二点:HQL优化
(HQL知识图)
假如想好好了解一下的建议看一下这篇博客HQL详细使用,我个人认为写的还可以,知识总结的很细致。
总结:
1.实体查询:可以使用sql语句查询
2.实体的更新和删除:hibernate3中直接提供更加灵活更加效率的解决方法
3.属性查询:动态构造实例对象,对结果集进行封装
4.分组与排序:
A.Order by子句
B.Group by子句与统计查询
C.优化统计查询:内连接,外连接
5.参数绑定:和jdbc一样,对hibernate的参数绑定提供了丰富的支持。
第三点:主配置
查询缓存,同下面讲的缓存不太一样,它是针对HQL语句的缓存,即完全一样的语句再次执行时可以利用缓存数据。但是,查询缓存在一个交易系统(数据变更频繁,查询条件相同的机率并不大)中可能会起反作用:它会白白耗费大量的系统资源但却难以派上用场。
b) fetch_size,同JDBC的相关参数作用类似,参数并不是越大越好,而应根据业务特征去设置
c) batch_size同上。
生产系统中,切记要关掉SQL语句打印。
第三点:缓存
运行机制:
介于应用程序和物理数据源之间,其作用是为了降低应用程序对物理数据源访问的频数,从而提高运行性能。
缓存被广泛应用的用于优化数据库。当一些数据被从数据库中读取出来的时候,我们可以把它们放到缓存里。这样我们可以再次使用的时候直接从缓存中取出来,这样我们的效率就提高了很多。
控制范围:
一级缓存是session对象的生命周期通常对应的一个数据库事务或者一个应用事务,它是事务范围内的缓存
二级缓存是一个可插拔的缓存插件,它是由SessionFactory负责管理。由于SessionFactory对象的生命周期和应用程序的整个过程对应,所以二级缓存是进城范围或者集群范围内的缓存。用于初始化很少更改的数据、不重要的数据,不会并发访问的数据。
Hibernate缓存的一些问题和建议:hibernate的缓存
第四点:捉取策略
1. 捉取优化:Hibernate在关联关系之间进行导航,充分利用Hibernate提供的技术
2. 如何捉取
立即捉取:当捉取宿主对象时,同时捉取其相关对象和关联集以及属性
延迟加载:当捉宿主对象时,并不捉取其关联对象,而是当对其对象进行调用时才加载。
3. 捉取粒度:设置捉取个数
a) 实体延迟加载:通过使用动态代理实现
集合延迟加载:通过实现自有的SET/LIST,HIBERNATE提供了这方面的支持
c) 属性延迟加载:
第五点:批量数据处理(修改和删除)
即使是使用JDBC,在进行大批数据更新时,BATCH与不使用BATCH有效率上也有很大的差别。我们可以通过设置batch_size来让其支持批量操作。
举个例子,要批量删除某表中的对象,如“delete Account”,打出来的语句,会发现HIBERNATE找出了所有ACCOUNT的ID,再进行删除,这主要是为了维护二级缓存,这样效率肯定高不了,在后续的版本中增加了bulk delete/update,但这也无法解决缓存的维护问题。也就是说,由于有了二级缓存的维护问题,HIBERNATE的批量操作效率并不尽如人意!
在Hibernate2中,如果需要对任何数据进行修改和删除操作都需要先执行查询操作,在得到数据后才进行修改和删除。
1. 不适用Hibernate API而是直接使用JDBC API来做原生态SQL语句进行查询,这种方法比较好,相对来说较快。
2. 运用存储过程
3. 一定量范围内可以使用hibernate API,但是特大数据量不行。
第六点:事务控制:
事务方面对性能有影响的主要包括:事务方式的选用,事务隔离级别以及锁的选用
事务方式选用:如果不涉及多个事务管理器事务的话,不需要使用JTA,只有JDBC的事务控制就可以。
事务隔离级别:参见标准的SQL事务隔离级别
锁的选用:悲观锁(一般由具体的事务管理器实现),对于长事务效率低,但安全。乐观锁(一般在应用级别实现),如在HIBERNATE中可以定 义VERSION字段,显然,如果有多个应用操作数据,且这些应用不是用同一种乐观锁机制,则乐观锁会失效。因此,针对不同的数据应有不 同的策略,同前面许多情况一样,很多时候我们是在效率与安全/准确性上找一个平衡点,无论如何,优化都不是一个纯技术的问题,你应该 对你的应用和业务特征有足够的了解。
第七点:结果集的使用:
完成同样一件事,HIBERNATE提供了可供选择的一些方式,但具体使用什么方式,可能用性能/代码都会有影响。显示,一次返回十万条记录(List/Set/Bag/Map等)进行处理,很可能导致内存不够的问题,而如果用基于游标(ScrollableResults)或Iterator的结果集,则不存在这样的问题。
b) Session的load/get方法,前者会使用二级缓存,而后者则不使用。
c) Query和list/iterator,如果去仔细研究一下它们,你可能会发现很多有意思的情况,二者主要区别(如果使用了Spring,在HibernateTemplate中对应find,iterator方法):
i. list只能利用查询缓存(但在交易系统中查询缓存作用不大),无法利用二级缓存中的单个实体,但list查出的对象会写入二级缓存,但它一般只生成较少的执行SQL语句,很多情况就是一条(无关联)。
ii. iterator则可以利用二级缓存,对于一条查询语句,它会先从数据库中找出所有符合条件的记录的ID,再通过ID去缓存找,对于缓存中没有的记录,再构造语句从数据库中查出,因此很容易知道,如果缓存中没有任何符合条件的记录,使用iterator会产生N+1条SQL语句(N为符合条件的记录数)
通过iterator,配合缓存管理API,在海量数据查询中可以很好的解决内存问题,如:
while(it.hasNext()){
YouObject object = (YouObject)it.next();
session.evict(youObject);
sessionFactory.evice(YouObject.class, youObject.getId());
}
如果用list方法,很可能就出OutofMemory错误了。
通过上面的说明,我想你应该知道如何去使用这两个方法了。
d)集合的选用
在HIBERNATE 3.1文档的“19.5. Understanding Collection performance”中有详细的说明。
list()和iterator()区别
查询方式:
list只能利用查询缓存(但在交易系统中查询缓存作用不大),无法利用二级缓存中的单个实体,但是list查出的对象会写入二级缓存,但它一般只生成较少的sql语句,很多情况就是一条。
iterator则利用二级缓存,对于一条查询语句,它会先从数据库中找到所有符合条件的记录的ID,在通过ID去缓存找,对于缓存中没有的记录,在构造语句从数据库查出,第一次的执行会产生N+1条SQL语句。
产生结果:
用list可能会溢出
通过Iterator,配合缓存管理API,在海量数据查询中可以很好的解决内存问题。
综合考虑:
一般List会填充二级缓存,却不能利用二级缓存,而Iterator可以读二级缓存,然而无法命中的话,效率很低效。一般处理方法,就是第一次查询使用list,随后使用iterator查询。
总结
Hibernate优化总结还有主配置、方法选用、事物控制没有涉及到,因为它们相对来说这些方面比较简单,但是还是很重要的。
在实施一个项目的时候我们没有必要想这些问题,做项目的时候第一步运行起来,第二步优化一下。在很多小型项目中第二步一般都不会去做,所以说我们做工程的时候还是要牢记运行出来,假如自己作为研究或者这个问题比较严重的话我们才考虑优化。
Hibernate调优方面没有最有只有更优,让我们不断积极找到优化的方法,来优化我们的程序,来优化我们自己。