1. 首先要制定数据清理的方法和策略,具体内容略。
2. 对现网数据量进行摸底调查,哪些表需要清理并整理出。
3. 具体清理。
3.1. 分区表数据清理:
先判定该分区表的索引是LOCAL索引还是GLOBAL索引,这涉及到如何对分区表进行数据清理。
先通过如下语句来查看分区表上建立的索引类型:
select t.table_name,i.index_name,i.table_owner
from dba_indexes i,dba_tables t
where i.table_name = t.table_name
and t.partitioned='yes'
and i.partitioned='no';
3.1.1 将全局索引修改为本地索引的方法见下:
首先要删除原有分区表的全局GLOBAL索引,也分为两种情况,一种是索引是主键,一种是索引不是主键。
3.1.1.1 索引为主键的情况,先将原主键及索引删除:
alter table 表名 drop constraint 约束名 cascade;
然后再创建主键及本地索引,注意local和online参数:
alter table 表名 add constraint 约束名
primary key (列名, 列名2) using index local online
TABLESPACE 表空间
PCTFREE等原有的存储参数
nologging;
3.1.1.2 另一种索引不为主键的情况,先将索引删除:
dorp index 索引名;
然后再用下面语句为该分区表创建本地索引:
create index 索引名 on 表名.列名 local online
TABLESPACE 表空间
PCTFREE等原有的存储参数
nologging;
3.1.2 确认所有的分区表上的索引均为本地索引后,按如下方法进行分区数据的清理,并恢复分区的最高水位值到初始点:
alter table 表名 truncate partition 分区名;
3.2. 非分区表的数据清理:
有3种清理数据的方法:
3.2.1 使用循环delete的方法对表数据进行删除。
例:
declare
begin
loop
delete from 表名
where 日期字段 < sysdate-180 --或流水号字段,时间根据实际情况调整
and rownum<5000; --每次删5000条
exit when SQL%ROWCOUNT=0;
commit;
end loop;
exception
when others then
rollback;
return;
end;
3.2.2 使用“create …… as select * from…… where……”备份原表,再将原表truncate,
最后将备份表的数据插回原表insert …… select *,实例省略。
这个方法的主线是:
Rename备份表->新建表(不建索引)->数据插回->重建索引;
或者:
备份表->truncate原表->原表索引约束失效,删除索引->数据插回->原表索引约束激活,重建索引
3.2.3 将A表数据exp出为A.dmp文件,再drop掉A表,重建A表后再将A.dmp数据imp回去(一般用于清理高水位表,如果要实现清理数据,则导出dmp时增加query条件过滤旧数据,原理和方法2一样)。
例:
导出数据:
exp userid=域名/密码@SID file= e:\temp\A.dmp log= e:\temp\dmp.log buffer=1046000000 tables=A query=' where 字段名>sysdate-180'
drop原表: drop table A;
导回原表:
imp userid=域名/密码@SID file= e:\temp\A.dmp ignore=y fromuser=用户名 touser=用户名 log= e:\temp\dmp.log
对于首次执行清理,如果要清理大量数据,只保留少量数据时用第二种方法,该方法除了可以清理数据外,还能够解决高水位的问题;但是如果清理的数据量不大,或者已经进入持续的自动阶段,则用第一种方法。
操作前说明:
对于将本地索引重建为分区索引的,还需要注意以下事项:
1、 要有足够的临时表空间,因为重建索引需要对数据进行排序,要占用大量的临时表空间。
--用下面语句来检查索引的数据库空间大小:
select segment_name,segment_type,sum(bytes)
from dba_segments
where segment_type like 'INDEX%'
and segment_name='索引名'
group by segment_name,segment_type;
--用下面语句检查临时表空间大小:
select * from dba_temp_files;
--用下面语句检查当前是否在使用临时表空间:
select * from v$sort_usage;
--下面语句用于增加临时表空间:
alter database tempfile '/dev/tab_temp' resize 200M;