MPP主备集群搭建

  • 1:规划
  • 1.1:主库端口规划:
  • 1.2:备库端口规划:
  • 1.3:守护进程规划:
  • 2:创建实例
  • MPP01:
  • MPP02:
  • 3:备份还原
  • 将EP_01的数据备份到EP_12
  • 将EP_11的数据备份到EP_02
  • 4:配置
  • 在MPP01配置主库EP_01
  • 在MPP02配置主库EP_11
  • 在MPP02配置备库EP_12
  • 在MPP01配置备库EP_02
  • 配置守护进程
  • 配置监视器
  • 5:启动
  • 以mount方式启动所有实例
  • 启动守护进程
  • 启动监视器:


1:规划

机器名

IP地址

初始状态

MPP01

192.168.139.100

主库EP_01,备库EP_02

MPP02

192.168.139.101

主库EP_11,备库EP_12

监视器

192.168.139.101

监视器

1.1:主库端口规划:

达梦 有没有 show databases 达梦 mpp_服务器

1.2:备库端口规划:

达梦 有没有 show databases 达梦 mpp_linux_02

1.3:守护进程规划:

达梦 有没有 show databases 达梦 mpp_服务器_03

2:创建实例

MPP01:

主:./dminit PATH=/home/dmdba/dmdbms/data DB_NAME=EP_01 INSTANCE_NAME=“EP_01” PORT_NUM=5239
备:./dminit PATH=/home/dmdba/dmdbms/data DB_NAME=EP_02 INSTANCE_NAME=“EP_02” PORT_NUM=5240
初始化完成后,记得分别开停库一次。

分别修改dm.ini,使ARCH_INI=1
增加新文件dmarch.ini,放在dm.ini同一目录:
EP_01的:
[ARCHIVE_LOCAL1]
ARCH_TYPE = LOCAL #本地归档类型
ARCH_DEST = /home/dmdba/dmdbms/data/EP_01/bak #本地归档文件存放路径
ARCH_FILE_SIZE = 128 #单位 Mb,本地单个归档文件最大值
ARCH_SPACE_LIMIT = 1024 #单位 Mb,0 表示无限制,范围 1024~4294967294M

EP_02的:
[ARCHIVE_LOCAL1]
ARCH_TYPE = LOCAL #本地归档类型
ARCH_DEST = /home/dmdba/dmdbms/data/EP_02/bak #本地归档文件存放路径
ARCH_FILE_SIZE = 128 #单位 Mb,本地单个归档文件最大值
ARCH_SPACE_LIMIT = 1024 #单位 Mb,0 表示无限制,范围 1024~4294967294M

MPP02:

主:./dminit PATH=/home/dmdba/dmdbms/data DB_NAME=EP_11 INSTANCE_NAME=“EP_11” PORT_NUM=5239
备:./dminit PATH=/home/dmdba/dmdbms/data DB_NAME=EP_12 INSTANCE_NAME=“EP_12” PORT_NUM=5240
初始化完成后,记得分别开停库一次。

分别修改dm.ini,使ARCH_INI=1
增加新文件dmarch.ini,放在dm.ini同一目录:
EP_11的:
[ARCHIVE_LOCAL1]
ARCH_TYPE = LOCAL #本地归档类型
ARCH_DEST = /home/dmdba/dmdbms/data/EP_11/bak #本地归档文件存放路径
ARCH_FILE_SIZE = 128 #单位 Mb,本地单个归档文件最大值
ARCH_SPACE_LIMIT = 1024 #单位 Mb,0 表示无限制,范围 1024~4294967294M

EP_12的:
[ARCHIVE_LOCAL1]
ARCH_TYPE = LOCAL #本地归档类型
ARCH_DEST = /home/dmdba/dmdbms/data/EP_12/bak #本地归档文件存放路径
ARCH_FILE_SIZE = 128 #单位 Mb,本地单个归档文件最大值
ARCH_SPACE_LIMIT = 1024 #单位 Mb,0 表示无限制,范围 1024~4294967294M

3:备份还原

将EP_01的数据备份到EP_12

1、对主库EP_01进行脱机备份:
./dmrman ctlstmt=“backup database ‘/home/dmdba/dmdbms/data/EP_01/dm.ini’ full to BACKUP_FILE_01 backupset ‘/home/dmdba/dmdbms/data/EP_01/BACKUP_FILE_01’”

2、将备份拷贝传输到备库EP_12所在的机器MPP02
cd /home/dmdba/dmdbms/data/EP_01
scp -r BACKUP_FILE_01/ dmdba@192.168.139.101:/home/dmdba/dmdbms/data/EP_12

3、在机器MPP02执行脱机还原恢复更新
还原:./dmrman CTLSTMT=“RESTORE DATABASE ‘/home/dmdba/dmdbms/data/EP_12/dm.ini’ FROM BACKUPSET ‘/home/dmdba/dmdbms/data/EP_12/BACKUP_FILE_01’”

恢复:./dmrman CTLSTMT=“RECOVER DATABASE ‘/home/dmdba/dmdbms/data/EP_12/dm.ini’ FROM BACKUPSET ‘/home/dmdba/dmdbms/data/EP_12/BACKUP_FILE_01’”

更新DB_MAGIC:./dmrman CTLSTMT=“RECOVER DATABASE’/home/dmdba/dmdbms/data/EP_12/dm.ini’ UPDATE DB_MAGIC”

将EP_11的数据备份到EP_02

1、在MPP02对主库EP_11进行脱机备份:
./dmrman ctlstmt=“backup database ‘/home/dmdba/dmdbms/data/EP_11/dm.ini’ full to BACKUP_FILE_11 backupset ‘/home/dmdba/dmdbms/data/EP_11/BACKUP_FILE_11’”

2、将备份拷贝传输到备库EP_02所在的机器MPP01
cd /home/dmdba/dmdbms/data/EP_11
scp -r BACKUP_FILE_11/ dmdba@192.168.139.100:/home/dmdba/dmdbms/data/EP_02

3、在机器MPP01执行脱机还原恢复更新
还原:./dmrman CTLSTMT=“RESTORE DATABASE ‘/home/dmdba/dmdbms/data/EP_02/dm.ini’ FROM BACKUPSET ‘/home/dmdba/dmdbms/data/EP_02/BACKUP_FILE_11’”

恢复:./dmrman CTLSTMT=“RECOVER DATABASE ‘/home/dmdba/dmdbms/data/EP_02/dm.ini’ FROM BACKUPSET ‘/home/dmdba/dmdbms/data/EP_02/BACKUP_FILE_11’”

更新DB_MAGIC:./dmrman CTLSTMT=“RECOVER DATABASE ‘/home/dmdba/dmdbms/data/EP_02/dm.ini’ UPDATE DB_MAGIC”

4:配置

在MPP01配置主库EP_01

1:配置dm.ini
cd /home/dmdba/dmdbms/data/EP_01/
vi dm.ini
INSTANCE_NAME =EP_01
ALTER_MODE_STATUS = 0 #不允许手工方式修改实例模式/状态/OGUID
ENABLE_OFFLINE_TS = 2 #不允许备库 OFFLINE 表空间
MAL_INI = 1 #打开 MAL 系统
ARCH_INI = 1 #打开归档配置
MPP_INI = 1 #启用 MPP 配置
2:配置dmmal.ini
各主备库的 dmmal.ini 配置必须完全一致
MAL_CHECK_INTERVAL = 5 #MAL 链路检测时间间隔
MAL_CONN_FAIL_INTERVAL = 5 #判定 MAL 链路断开的时间
[MAL_INST1]
MAL_INST_NAME = EP_01 #实例名,和 dm.ini 中的 INSTANCE_NAME 一致
MAL_HOST = 192.168.139.100 #MAL 系统监听 TCP 连接的 IP 地址
MAL_PORT = 5337 #MAL 系统监听 TCP 连接的端口
MAL_INST_HOST = 192.168.139.100 #实例的对外服务 IP 地址
MAL_INST_PORT = 5239 #实例的对外服务端口,和 dm.ini 中的 PORT_NUM 一致
MAL_DW_PORT = 5253 #实例对应的守护进程监听 TCP 连接的端口
MAL_INST_DW_PORT = 5243 #实例监听守护进程 TCP 连接的端口
[MAL_INST2]
MAL_INST_NAME = EP_11
MAL_HOST = 192.168.139.101
MAL_PORT = 5337
MAL_INST_HOST = 192.168.139.101
MAL_INST_PORT = 5239
MAL_DW_PORT = 5253
MAL_INST_DW_PORT = 5243
[MAL_INST3]
MAL_INST_NAME =EP_02
MAL_HOST = 192.168.139.100
MAL_PORT = 5338
MAL_INST_HOST = 192.168.139.100
MAL_INST_PORT = 5240
MAL_DW_PORT = 5254
MAL_INST_DW_PORT = 5244
[MAL_INST4]
MAL_INST_NAME = EP_12
MAL_HOST = 192.168.139.101
MAL_PORT = 5338
MAL_INST_HOST = 192.168.139.101
MAL_INST_PORT = 5240
MAL_DW_PORT = 5254
MAL_INST_DW_PORT = 5244
3:配置dmarch.ini
修改 dmarch.ini,配置实时归档。除了本地归档外,其他归档配置项中的 ARCH_DEST 表示实例是 Primary 模式时,需要同步归档数据的目标实例名。当前实例 EP_01 是主库,需要向 MPP 备库EP_12同步数据,因此实时归档的 ARCH_DEST 配置为 EP_12。
[ARCHIVE_REALTIME1]
ARCH_TYPE = REALTIME #实时归档类型
ARCH_DEST = EP_12 #实时归档目标实例名
[ARCHIVE_LOCAL1]
ARCH_TYPE = LOCAL #本地归档类型
ARCH_DEST = /home/dmdba/dmdbms/data/EP_01/bak #本地归档文件存放路径
ARCH_FILE_SIZE = 128 #单位 Mb,本地单个归档文件最大值
ARCH_SPACE_LIMIT = 1024 #单位 Mb,0 表示无限制,范围 1024~4294967294M
4:配置dmmpp.ctl
dmmpp.ctl 是二进制文件,由 dmmpp.ini 文本通过 dmctlcvt 工具转换而来
先配置dmmpp.ini:
[service_name1]
mpp_seq_no = 0
mpp_inst_name = EP_01
[service_name2]
mpp_seq_no = 1
mpp_inst_name = EP_11
转换dmmpp.ini为dmmpp.ctl(bin目录下):
./dmctlcvt TYPE=2 SRC=/home/dmdba/dmdbms/data/EP_01/dmmpp.ini DEST=/home/dmdba/dmdbms/data/EP_01/dmmpp.ctl
5、以mount方式启动主库
./dmserver /home/dmdba/dmdbms/data/EP_01/dm.ini mount
6、配置OGUID
启动命令行工具 DIsql,使用 MPP 类型为 LOCAL 方式,登录主库设置 OGUID 值。
./disql SYSDBA/SYSDBA*LOCAL@localhost:5239
SQL>SP_SET_PARA_VALUE(1, ‘ALTER_MODE_STATUS’, 1);
SQL>sp_set_oguid(1393331);
SQL>SP_SET_PARA_VALUE(1, ‘ALTER_MODE_STATUS’, 0);
7、修改数据库模式
SQL>alter database primary;

在MPP02配置主库EP_11

1、配置dm.ini
INSTANCE_NAME = EP_11
PORT_NUM = 5239 #数据库实例监听端口
ALTER_MODE_STATUS = 0 #不允许手工方式修改实例模式/状态/OGUID
ENABLE_OFFLINE_TS = 2 #不允许备库 OFFLINE 表空间
MAL_INI = 1 #打开 MAL 系统
ARCH_INI = 1 #打开归档配置
MPP_INI = 1 #启用 MPP 配置
2、配置dmmal.ini
将MPP01的dmmal.ini拷贝发送过来。
例如:scp -r 。。。 dmdba@192.168.139.100:/home/dmdba/。。。
3、配置dmarch.ini
当前实例 EP_11 是主库,需要向 MPP 备库EP_02 同步数据,因此实时归档的 ARCH_DEST 配置为 EP_02。
[ARCHIVE_REALTIME1]
ARCH_TYPE = REALTIME
ARCH_DEST = EP_02 #实时归档目标实例名
[ARCHIVE_LOCAL1]
ARCH_TYPE = LOCAL #本地归档类型
ARCH_DEST = /home/dmdba/dmdbms/data/EP_11/bak #本地归档文件存放路径
ARCH_FILE_SIZE = 128 #单位 Mb,本地单个归档文件最大值
ARCH_SPACE_LIMIT = 0 #单位 Mb,0 表示无限制,范围 1024~4294967294M
4、配置dmmpp.ctl
将MPP01机器上的 dmmpp.ctl拷贝发送过来。
5、以mount方式启动主库
./dmserver /home/dmdba/dmdbms/data/EP_11/dm.ini mount
6、配置OGUID
启动命令行工具 DIsql,使用 MPP 类型为 LOCAL 方式,登录主库设置 OGUID 值。
./disql SYSDBA/SYSDBA*LOCAL@localhost:5239
SQL>SP_SET_PARA_VALUE(1, ‘ALTER_MODE_STATUS’, 1);
SQL>sp_set_oguid(1393332);
SQL>SP_SET_PARA_VALUE(1, ‘ALTER_MODE_STATUS’, 0);
7、修改数据库模式
SQL>alter database primary;

在MPP02配置备库EP_12

1、配置dm.ini
INSTANCE_NAME = EP_12
PORT_NUM = 5240 #数据库实例监听端口
DW_INACTIVE_INTERVAL = 60 #接收守护进程消息超时时间
ALTER_MODE_STATUS = 0 #不允许手工方式修改实例模式/状态/OGUID
ENABLE_OFFLINE_TS = 2 #不允许备库 OFFLINE 表空间
MAL_INI = 1 #打开 MAL 系统
ARCH_INI = 1 #打开归档配置
MPP_INI = 1 #打开 MPP 配置
RLOG_SEND_APPLY_MON = 64 #统计最近 64 次的日志重演信息
2、配置dmmal.ini
将MPP01的dmmal.ini拷贝发送过来。
3、配置dmarch.ini
当前实例 EP_12 是备库,守护系统配置完成后,可能在各种故障处理中,EP_12 切换为新的主库,正常情况下, EP_01 会切换为新的备库,需 要 向 EP_01 同 步 数 据 , 因 此 实 时 归 档 的 ARCH_DEST 配 置 为EP_01。
[ARCHIVE_REALTIME1]
ARCH_TYPE = REALTIME
ARCH_DEST = EP_01 #实时归档目标实例名
[ARCHIVE_LOCAL1]
ARCH_TYPE = LOCAL #本地归档类型
ARCH_DEST = /home/dmdba/dmdbms/data/EP_12/bak #本地归档文件存放路径
ARCH_FILE_SIZE = 128 #单位 Mb,本地单个归档文件最大值
ARCH_SPACE_LIMIT = 0 #单位 Mb,0 表示无限制,范围 1024~4294967294M
4、配置dmmpp.ctl
将MPP01机器上的 dmmpp.ctl拷贝发送过来。
5、以mount方式启动备库
./dmserver /home/dmdba/dmdbms/data/EP_12/dm.ini mount
6、配置OGUID
启动命令行工具 DIsql,使用 MPP 类型为 LOCAL 方式,登录主库设置 OGUID 值。
./disql SYSDBA/SYSDBA*LOCAL@localhost:5240
SQL>SP_SET_PARA_VALUE(1, ‘ALTER_MODE_STATUS’, 1);
SQL>sp_set_oguid(1393331);
SQL>SP_SET_PARA_VALUE(1, ‘ALTER_MODE_STATUS’, 0);
7、修改数据库模式
SQL>ALTER DATABASE STANDBY;

在MPP01配置备库EP_02

1、配置dm.ini
INSTANCE_NAME = EP_02
PORT_NUM = 5240 #数据库实例监听端口
DW_INACTIVE_INTERVAL = 60 #接收守护进程消息超时时间
ALTER_MODE_STATUS = 0 #不允许手工方式修改实例模式/状态/OGUID
ENABLE_OFFLINE_TS = 2 #不允许备库 OFFLINE 表空间
MAL_INI = 1 #打开 MAL 系统
ARCH_INI = 1 #打开归档配置
MPP_INI = 1 #打开 MPP 配置
2、配置dmmal.ini
发送文件
3、配置dmarch.ini
当前实例 EP_02 是备库,守护系统配置完成后,可能在各种故障处理中, EP_02 切换为新的主库,正常情况下, EP_11 会切换为新的备库,需 要 向EP_11 同 步 数 据 , 因 此 实 时 归 档 的 ARCH_DEST 配 置 为EP_11。
[ARCHIVE_REALTIME1]
ARCH_TYPE = REALTIME
ARCH_DEST =EP_11 #实时归档目标实例名
[ARCHIVE_LOCAL1]
ARCH_TYPE = LOCAL #本地归档类型
ARCH_DEST = /home/dmdba/dmdbms/data/EP_02/bak #本地归档文件存放路径
ARCH_FILE_SIZE = 128 #单位 Mb,本地单个归档文件最大值
ARCH_SPACE_LIMIT = 0 #单位 Mb,0 表示无限制,范围 1024~4294967294M
4、配置dmmpp.ctl
同上
5、以mount方式启动备库
./dmserver /home/dmdba/dmdbms/data/EP_02/dm.ini mount
6、配置OGUID
启动命令行工具 DIsql,使用 MPP 类型为 LOCAL 方式,登录主库设置 OGUID 值。
./disql SYSDBA/SYSDBA@localhost:5240
SQL>SP_SET_PARA_VALUE(1, ‘ALTER_MODE_STATUS’, 1);
SQL>sp_set_oguid(1393332);
7、修改数据库模式
SQL>ALTER DATABASE STANDBY;
SQL>SP_SET_PARA_VALUE(1, ‘ALTER_MODE_STATUS’, 0);

配置守护进程

一般来说,每个单独的实例都是使用一个单独的守护进程守护。本例中,由于同一台机器上有不同组的两个实例,我们可以只配置一个守护进程,同时守护两个实例。
MPP01器上配置 dmwatcher.ini,配置为全局守护类型,使用自动切换模式。放在/home/dmdba/dmdbms/data/EP_01下:
[GRP1]
DW_TYPE = GLOBAL #全局守护类型
DW_MODE = AUTO #自动切换模式
DW_ERROR_TIME = 10 #远程守护进程故障认定时间
INST_RECOVER_TIME = 60 #主库守护进程启动恢复的间隔时间
INST_ERROR_TIME = 10 #本地实例故障认定时间
INST_OGUID = 1393331#守护系统唯一 OGUID 值
INST_INI = /home/dmdba/dmdbms/data/EP_01/dm.ini #dm.ini 配置文件路径
INST_AUTO_RESTART = 1 #打开实例的自动启动功能
INST_STARTUP_CMD = /home/dmdba/dmdbms/bin/dmserver #命令行方式启动
RLOG_SEND_THRESHOLD = 0 #指定主库发送日志到备库的时间阈值,默认关闭
RLOG_APPLY_THRESHOLD = 0 #指定备库重演日志的时间阈值,默认关闭
[GRP2]
DW_TYPE = GLOBAL #全局守护类型
DW_MODE = AUTO #自动切换模式
DW_ERROR_TIME = 10 #远程守护进程故障认定时间
INST_RECOVER_TIME = 60 #主库守护进程启动恢复的间隔时间
INST_ERROR_TIME = 10 #本地实例故障认定时间
INST_OGUID = 1393332 #守护系统唯一 OGUID 值
INST_INI = /home/dmdba/dmdbms/data/EP_02/dm.ini #dm.ini 配置文件路径
INST_AUTO_RESTART = 1 #打开实例的自动启动功能
INST_STARTUP_CMD = /home/dmdba/dmdbms/bin/dmserver #命令行方式启动
RLOG_SEND_THRESHOLD = 0 #指定主库发送日志到备库的时间阈值,默认关闭
RLOG_APPLY_THRESHOLD = 0 #指定备库重演日志的时间阈值,默认关闭

MPP02器上配置 dmwatcher.ini,配置为全局守护类型,使用自动切换模式,放在/home/dmdba/dmdbms/data/EP_11下:
[GRP1]
DW_TYPE = GLOBAL #全局守护类型
DW_MODE = AUTO #自动切换模式
DW_ERROR_TIME = 10 #远程守护进程故障认定时间
INST_RECOVER_TIME = 60 #主库守护进程启动恢复的间隔时间
INST_ERROR_TIME = 10 #本地实例故障认定时间
INST_OGUID = 1393331#守护系统唯一 OGUID 值
INST_INI = /home/dmdba/dmdbms/data/EP_12/dm.ini #dm.ini 配置文件路径
INST_AUTO_RESTART = 1 #打开实例的自动启动功能
INST_STARTUP_CMD = /home/dmdba/dmdbms/bin/dmserver #命令行方式启动
RLOG_SEND_THRESHOLD = 0 #指定主库发送日志到备库的时间阈值,默认关闭
RLOG_APPLY_THRESHOLD = 0 #指定备库重演日志的时间阈值,默认关闭
[GRP2]
DW_TYPE = GLOBAL #全局守护类型
DW_MODE = AUTO #自动切换模式
DW_ERROR_TIME = 10 #远程守护进程故障认定时间
INST_RECOVER_TIME = 60 #主库守护进程启动恢复的间隔时间
INST_ERROR_TIME = 10 #本地实例故障认定时间
INST_OGUID = 1393332 #守护系统唯一 OGUID 值
INST_INI = /home/dmdba/dmdbms/data/EP_11/dm.ini #dm.ini 配置文件路径
INST_AUTO_RESTART = 1 #打开实例的自动启动功能
INST_STARTUP_CMD = /home/dmdba/dmdbms/bin/dmserver #命令行方式启动
RLOG_SEND_THRESHOLD = 0 #指定主库发送日志到备库的时间阈值,默认关闭
RLOG_APPLY_THRESHOLD = 0 #指定备库重演日志的时间阈值,默认关闭

配置监视器

由于主备库的守护进程配置为自动切换模式,因此这里选择配置确认监视器。和普通监视器相比,确认监视器除了相同的命令支持外,在主库发生故障时,能够自动通知备库接管为新的主库,具有自动故障处理的功能。
配置dmmonitor.ini 确认监视器,其中 MON_DW_IP 中的 IP 和 PORT 和
dmmal.ini 中的 MAL_HOST 和 MAL_DW_PORT 配置项保持一致。放在/home/dmdba/dmdbms/data目录下:

MON_DW_CONFIRM = 1 #确认监视器模式
MON_LOG_PATH = /home/dmdba/dmdbms/log #监视器日志文件存放路径
MON_LOG_INTERVAL = 60 #每隔 60s 定时记录系统信息到日志文件
MON_LOG_FILE_SIZE = 32 #每个日志文件最大 32M
MON_LOG_SPACE_LIMIT = 0 #不限定日志文件总占用空间
[GRP1]
MON_INST_OGUID = 1393331 #组 GRP1 的唯一 OGUID 值
#以下配置为监视器到组 GRP1 的守护进程的连接信息,以―IP:PORT‖的形式配置
#IP 对应 dmmal.ini 中的 MAL_HOST,PORT 对应 dmmal.ini 中的 MAL_DW_PORT
MON_DW_IP = 192.168.139.100:5253
MON_DW_IP = 192.168.139.101:5254
[GRP2]
MON_INST_OGUID = 1393332 #组 GRP2 的唯一 OGUID 值
#以下配置为监视器到组 GRP2 的守护进程的连接信息,以―IP:PORT‖的形式配置
#IP 对应 dmmal.ini 中的 MAL_HOST,PORT 对应 dmmal.ini 中的 MAL_DW_PORT
MON_DW_IP = 192.168.139.101:5253
MON_DW_IP = 192.168.139.100:5254

5:启动

以mount方式启动所有实例

bin目录下输入:
./dmserver /home/dmdba/dmdbms/data/EP_01/dm.ini mount
./dmserver /home/dmdba/dmdbms/data/EP_02/dm.ini mount
./dmserver /home/dmdba/dmdbms/data/EP_11/dm.ini mount
./dmserver /home/dmdba/dmdbms/data/EP_12/dm.ini mount

启动守护进程

分别启动MPP01、MPP02机器上的守护进程,例如:
./dmwatcher /home/dmdba/dmdbms/data/EP_01/dmwatcher.ini
./dmwatcher /home/dmdba/dmdbms/data/EP_11/dmwatcher.ini
守护进程启动后,进入 Startup 状态,此时实例都处于 Mount 状态。守护进程开始广播自身和其监控实例的状态信息,结合自身信息和远程守护进程的广播信息,守护进程将本地实例 Open,并切换为 Open 状态。

启动监视器:

./dmmonitor /home/dmdba/dmdbms/data/dmmonitor.ini

所有实例open则成功

达梦 有没有 show databases 达梦 mpp_linux_04