文章目录
- 引言
- 一、前期准备工作
- 1.搭建新的MySQL数据库
- 2 .建立相应的数据表
- 2.1 数据库兼容性分析
- 2.1.1 字段类型兼容性分析
- 2.1.2 函数兼容性分析
- 2.1.3 存储过程分析
- 2.1.4 触发器分析
- 2.2 建表过程中其他需要注意的事项
- 3.为项目配置Oracle和MySQL双数据源
- 4.对项目进行改造添加MySQL数据CRUD代码
- 二、数据迁移操作步骤
- 1、配置初始化
- 2、同步数据检查
- 3、全量数据迁移
- 4、检查全量迁移的数据
- 5、开启双写
- 6、获取迁移过程中oracle数据库的增量数据
- 7、增量数据脚本准备
- 8、数据补偿
- 9、核对整体数据
- 10、在灰度环境里验证数据的正确性
- 11、数据库读取的配置设置为从MySQL数据库读取。
- 12、数据库写入的配置设置为只写MySQL
- 三、数据迁移的经验教训
- 1. 遇到的坑
引言
随着技术的进步,许多企业开始考虑将他们的数据从Oracle迁移到更现代、成本效益更高的数据库系统如MySQL或PostgreSQL。本文将详细描述我们如何进行这样的数据迁移过程。
一、前期准备工作
1.搭建新的MySQL数据库
首先,我们需要设置一个新的MySQL数据库环境,这将作为我们的新数据源。这包括安装MySQL服务器,创建数据库,以及配置适当的用户权限。
2 .建立相应的数据表
我们可以使用PowerDesigner等数据表模型设计工具,将Oracle的模型转换成MySQL模型,然后根据这个模型生成DDL脚本。这些脚本可能需要根据实际情况进行一些修改。例如,我们可能需要调整字段类型以适应MySQL的特性,或者修改索引和约束的定义。
2.1 数据库兼容性分析
2.1.1 字段类型兼容性分析
以下是常用的oracle字段类型和和mysql字段类型的对应关系 ,如果使用特殊的字段类型,需要检查确认字段转换是否符合真实需求。
oracle字段类型 | mysql字段类型 |
varchar2 | varchar |
number(1,0))->number(2,0) | tinyint |
number(3,0)->number(4,0) | smallint |
number(5,0)->number(6,0) | mediumint |
number(7,0)->number(9,0) | int |
number(10,0) -> number(18,0) | bigint |
number(x,y) | decimal(x,y) |
date | datetime |
timestamp(6) | datetime |
char | varchar |
clob | Text 或 Midiumtext 或 longtext |
2.1.2 函数兼容性分析
Oracle和MySQL的函数有一定对的相似性也要有一定的区别,下面表格列出了Oracle和MySQL常用函数的对比和区别。
功能 | oracle函数 | mysql函数 | 备注 |
舍入函数 | round | round | 一样 |
取绝对值 | abs | abs | 一样 |
返回 expr 的最小或最大值 | Max(expr)/Min(expr) | Max(expr)/Min(expr) | 一样 |
在字符串 str 中所有出现的字符串 from_str 均被 to_str 替换 | REPLACE(str,from_str,to_str) | REPLACE(str,from_str,to_str) | 一样 |
截取函数 | SUBSTR(‘abcd’,2,2) | substring(‘abcd’,2,2) | 函数名称不同 |
获取长度 | length(str) | char_length() | 函数名称不同 |
转大写 | UPPER(str) | UPPER(str) | 一样 |
转小写 | LOWER(str) | LOWER(str) | 一样 |
转字符 | TO_CHAR(SQLCODE) | date_format/ time_format | 函数名称不同 |
转时间 | to_date(str,format) | STR_TO_DATE(str,format) | 函数名称不同 |
获取当前时间 | SYSDATE | now() / SYSDATE() | 函数名称不同 |
求和 | SUM(num) | SUM(num) | 一样 |
返回两个日期之间的天数 | (D1-D2) | DATEDIFF(date1,date2) |
2.1.3 存储过程分析
是否使用存储过程?存储过程的个数?复杂度?
在这次的案例中,没有使用存储过程,因此不需要进行这方面的分析。
2.1.4 触发器分析
是否使用触发器?个数?使用的场景?
公司的数据库使用规范里禁止使用触发器,因此这次也不需要进行这方面的分析。
2.2 建表过程中其他需要注意的事项
- 自增主键 mysql默认需要有自增主键,而oracle的表可以不加主键
- 编码格式:oracle的编码格式utf8在mysql需要修改成utf8mb4 要确保所有的表都有一个自增的主键列。
- 时间字段:时间字段需要精确到时分秒的需要修改为datatime类型。这是因为MySQL的DATETIME类型可以存储到秒级别的时间信息,而Oracle的DATE类型只能存储到天级别的时间信息。
- 索引格式:索引格式需要按照规范重新定义,最好在测试环境中进行检查和校验。这是因为Oracle和MySQL的索引实现方式有所不同,直接复制索引可能会导致性能问题。
3.为项目配置Oracle和MySQL双数据源
在项目的数据源配置里添加刚刚新建的MySQL数据源配置,并配置双数据源和Mapper的匹配规则。
4.对项目进行改造添加MySQL数据CRUD代码
添加一套针对MuSQL数据库CRUD的Dao和Mapper代码,同时我们写了一个注解以切面的方式实现根据配置实例化Oracle的Dao、MySQl的Dao、同时调用Oracle和MySQLDao的功能。
改造方式:
数据库迁移切换流程:
二、数据迁移操作步骤
数据迁移操作的答题步骤如下图所示:
1、配置初始化
数据库写入的配置设置为只写Oracle数据库。数据库读取的配置设置为从OracleL数据库读取。
2、同步数据检查
查询待迁移的几张表的数据量:
select count(1) from table;
3、全量数据迁移
在迁移工具上执行数据迁移脚本SQL
4、检查全量迁移的数据
查询迁移后的数据量,检查是否和需要迁移的数据量能匹配:
5、开启双写
数据库写入的配置设置为Oracle数据库和MYSQl数据库双写
6、获取迁移过程中oracle数据库的增量数据
查询updated_time在全量数据迁移开始时间之后的数据
select * from table whereupdated_time>to_Date(‘2022/12/16 04:00:00’, ‘yyyy/mm/dd hh24:mi:ss’)
7、增量数据脚本准备
根据监控的增量数据对比,找出需要新增和修改的数据,准备脚本
8、数据补偿
在迁移工具上执行数据补偿脚本SQL
9、核对整体数据
我们有额外的数据核对方案,通过应用读Oracle,再异步读取MySQL并进行对比的方式进行业务表的数据核对。这样可以确保数据的一致性。
10、在灰度环境里验证数据的正确性
将灰度机器的数据库读取的配置设置为从MySQL数据库读取。并在灰度环境验证数据的正确性
11、数据库读取的配置设置为从MySQL数据库读取。
将正式环境的机器的数据库读取的配置设置为从MySQL数据库读取。
12、数据库写入的配置设置为只写MySQL
在生产环境运行一段时间,如果运行平稳的话,就可以关闭数据库双写,将数据库写入配置改为只写MySQL数据库了。
三、数据迁移的经验教训
1. 遇到的坑
在迁移过程中,我们发现了一些Oracle语法与MySQL语法不兼容的地方,有些写法在Oracle中可行,在MySQL中会报错:
(1)子查询语句要取别名
(2)字段别名需要注意,AS后是否为空
(3)条件语句中判断需要注意
(4)oracle转mysql条件语句is null需格外注意,在Oracle中null和空串是一个含义,在mysql中是两个含(只针对字段类型为varchar类型的字段)