国庆之前就准备做这个实验了。 后来时间不够,就没搞了。 6天的长假一放,都散漫的不成样子了。懒散了很多。 今天7号。 上班也没啥精神,但是该做的实验还得继续。

 

Oracle 高可用性的三个主要体现是: RAC, Data Guard 和  所以熟练掌握这些技术就是评价DBA的标准一个。 RAC + Data Guard 主要用在灾备或者报表服务器上。 比如用RAC+ 逻辑standby 做报表,从而减轻RAC 系统的压力。 

 

关于Data Guard 的一些原理知识可以参考:

      Oracle Data Guard 理论知识


Oracle Data Gurad Physical Standby 相关说明

​http://www.cndba.cn/Dave/article/1174​


RAC 的知识参考:

 

RAC 的一些概念性和原理性的知识

​http://www.cndba.cn/Dave/article/1021​

 

Redhat 5.4 + ASM + RAW+ Oracle 10g RAC 安装文档

​http://www.cndba.cn/Dave/article/1010​

 

 

 

RAC 和 Data Guard 的组合有4种情况:

组合

Primary

 Standby

1

Single Instance

Single Instance

2

Single Instance

RAC

3

RAC

Single Instance

4

RAC

RAC

 

在RAC + DG 平台下,重用的几个视图:

(1)    v$archive_dest_status: 在Standby Database 上可以在这个视图中查看接收的日志编号,恢复的日志编号,从而可以了解Standby Database 和 Primary Database 日志的差别。 如果standby 比Primary 滞后太多,可以考虑增加恢复进程。 该视图中的recovery_mode 列也显示了是否使用了实时恢复(Real-Time Apply).

(2)    v$archive_dest: 这个视图中的error 列可以用于辅助诊断。

(3)    v$managed_standby:  这个视图可以确认standby RAC中,哪个实例是执行recover 的实例。

 

 

下面实验是RAC + Single standby 的模式。

 

一. 测试环境

 

1.1  RAC Primary Database 环境

 

RAC primary

Rac1

Rac2

Public IP

10.85.10.1

10.85.10.2

Private IP

192.168.1.200

192.168.1.201

Virtual IP

10.85.10.3

10.85.10.4

Instance

Orcl1

Orcl2

DB_NAME

Orcl

Data,Control File, Redo File

ASM

 

1.2  Standby Database 环境

 

Single Instance Standby

 说明

IP

10.85.10.5

Oracle

非RAC 版本

Instance

Orcl

Data,Control File,Redo File

/u01

 

 

二.配置说明

 

1.3  switchover 之前,这时RAC是Primary Database

(1)    RAC的每个实例都要配置日志发送,目的地指向Standby。

(2)    确认日志发送的方法。如:LGWR

(3)    Standby 配置日志接收方法,如:standby redo log。

(4)    启动MRP

 

1.4  switchover 之后,此时,rac 是standby database

如果Standby 是RAC,则日志接收和日志恢复可以是不同的Instance。 因此Oracle 在术语上把这两种实例分别叫作Receive Instance 和 Recover Instance。 在这个实验中,放在一个实例上进行。

 

(1)    Single Instance 的日志只发送到RAC的一个实例。

(2)    确认RAC 的日志接收方法,如: Standby Redo Log。

(3)    在RAC的一个实例上启动MRP.

 

 

三. 开始搭建

3.1 主库归档模式设置

       Data Guard 用的归档日志来完成同步, 所以在实验之前, 主库必须是归档模式。 这里就RAC 的归档。 关于RAC的归档参考Blog RAC 之 RMAN 备份中的1.2 节。 设置归档就那么几步, 设置好归档目录,然后关闭所以节点,最后在一个节点上将模式设置为归档就ok了。

 

RAC 之 RMAN 备份

​http://www.cndba.cn/Dave/article/1001​

 

 

 

3.2 准备备库环境

 

安装Oracle软件,并建立实例的相关目录。Linux 平台上Oracle 的安装参考blog:

              linux平台下oracle数据库安装

              ​​http://www.cndba.cn/dave/article/211​

 

 

在备库创建相关目录

mkdir -p  $ORACLE_BASE/oradata/orcl/datafile

mkdir -p  $ORACLE_BASE/oradata/orcl/tempfile

mkdir -p  $ORACLE_BASE/admin/orcl/adump

mkdir -p  $ORACLE_BASE/admin/orcl/bdump

mkdir -p  $ORACLE_BASE/admin/orcl/cdump

mkdir -p  $ORACLE_BASE/admin/orcl/dpdump

mkdir -p  $ORACLE_BASE/admin/orcl/hdump

mkdir -p  $ORACLE_BASE/admin/orcl/pfile

mkdir -p  $ORACLE_BASE/admin/orcl/udump

 

这里要注意的地方:

       因为RAC 主库是用ASM 来存放的,所以这里设置的目录,与ASM 目录是不一致的, 这种情况下,我们就需要在参数文件里用db_file_name_convert和 log_file_name_convert 参数来进行转换。

 

 

3.3        配置主备库的监听,修改tnsnames.ora 和  文件

 

主备库的tnsnames.ora 文件是一致的。 修改成如下:

 

ORCL2 =

  (DESCRIPTION =

    (ADDRESS = (PROTOCOL = TCP)(HOST = rac2-vip)(PORT = 1521))

    (CONNECT_DATA =

      (SERVER = DEDICATED)

      (SERVICE_NAME = orcl)

      (INSTANCE_NAME = orcl2)

    )

  )

 

ORCL1 =

  (DESCRIPTION =

    (ADDRESS = (PROTOCOL = TCP)(HOST = rac1-vip)(PORT = 1521))

    (CONNECT_DATA =

      (SERVER = DEDICATED)

      (SERVICE_NAME = orcl)

      (INSTANCE_NAME = orcl1)

    )

  )

 

ORCL_ST =

  (DESCRIPTION =

    (ADDRESS = (PROTOCOL = TCP)(HOST =10.85.10.5 )(PORT = 1521))

    (CONNECT_DATA =

      (SERVER = DEDICATED)

      (SID = orcl)

    )

  )

 

这里要注意RAC 实例和单实例配置上的区别。 上面以用红色标出。

 

 

用net manager 工具,在备库创建一个监听。 也可以手动的在listener.ora 文件里添加如下内容:

      

SID_LIST_LISTENER_RAC2 =

  (SID_LIST =

    (SID_DESC =

      (SID_NAME = PLSExtProc)

      (ORACLE_HOME = /u01/app/oracle/product/10.2.0/db_1)

      (PROGRAM = extproc)

    )

   (SID_DESC =

      (SID_NAME = orcl)

      (ORACLE_HOME = /u01/app/oracle/product/10.2.0/db_1)

    )

  )

 

LISTENER =

  (DESCRIPTION =

    (ADDRESS = (PROTOCOL = TCP)(HOST = 10.85.10.5)(PORT = 1521))

  )

 

注意:SID_LIST_LISTENER 配置的是静态注册,如果没有该参数,而且Data Guard 启动顺序又不正确,那么在主库可能会报 PING[ARC1]: Heartbeat failed to connect to standby 'orcl_st'. Error is 12514. 错误,导致归档无法完成。

Oracle Listener 动态注册 与 静态注册

​http://www.cndba.cn/Dave/article/1177​

 

 

3.4        在主库上创建备库的密码文件和控制文件,并将文件传到备库的相关位置

 

3.4.1 密码文件:

 

[oracle@rac2 dbs]$ pwd

/u01/app/oracle/product/10.2.0/db_1/dbs

[oracle@rac2 bin]$ orapwd file=$ORACLE_HOME/dbs/orapworcl password=oracle

[oracle@rac2 bin]$ cd $ORACLE_HOME/dbs/

[oracle@rac2 dbs]$ ls

ab_+ASM2.dat  init+ASM2.ora  initorcl2.ora 

hc_+ASM2.dat  initdw.ora     orapw+ASM2    

hc_orcl2.dat  init.ora       orapworcl     

 

缺省情况下,win下口令文件的格式是pwdsid.ora,unix下的格式是orapwSID(大小写敏感)


参考:

Oracle OS认证 口令文件

​http://www.cndba.cn/Dave/article/1251​

 

传送文件:

[oracle@rac2 dbs]$ scp orapworcl 10.85.10.5://u01/app/oracle/product/10.2.0/db_1/dbs

orapworcl                                     100% 1536     1.5KB/s   00:00

[oracle@rac2 dbs]$

 

 

3.4.2 控制文件

 

[oracle@rac1 admin]$ export ORACLE_SID=orcl1

[oracle@rac1 admin]$ sqlplus /nolog

SQL*Plus: Release 10.2.0.1.0 - Production on Fri Oct 8 03:39:00 2010

Copyright (c) 1982, 2005, Oracle.  All rights reserved.

SQL> conn system/oracle;

Connected.

SQL> alter database create standby controlfile as '/u01/control01.ctl';

Database altered.

SQL>

 

--判断一个数据库是Primary还是Standby,就是通过控制文件来判断的。

 

传送文件:

[oracle@rac1 u01]$ scp control01.ctl 10.85.10.5://u01/app/oracle/oradata/orcl/datafile

control01.ctl                                 100%   15MB   1.4MB/s   00:11

 

在备库上将控制文件复制2份,并命名为control02.ctl, control03.ctl

 

[oracle@rac3 orcl]$ cp control01.ctl control02.ctl

[oracle@rac3 orcl]$ cp control01.ctl control03.ctl

[oracle@rac3 orcl]$ ls

control01.ctl  control02.ctl  control03.ctl

 

 

3.5 参数文件

 

3.5.1 主库的参数文件

 

先用spfile 来创建pfile 文件。 这里要注意的,不要直接用create pfile from spfile来创建。 至于为什么参考Blog:

       RAC 修改 spfile 参数

​http://www.cndba.cn/Dave/article/998​

 

[oracle@rac1 u01]$ sqlplus /nolog

SQL*Plus: Release 10.2.0.1.0 - Production on Fri Oct 8 04:33:51 2010

Copyright (c) 1982, 2005, Oracle.  All rights reserved.

SQL> conn / as sysdba

Connected.

SQL> create pfile='/u01/tmp.ora' from spfile;

File created.

SQL> !

[oracle@rac1 u01]$ cd /u01

[oracle@rac1 u01]$ ls

app               dave.log                    RAC_hot_database_backup.sh.out

backup            dave.ora                    tianlesoftware.dmp

control01.ctl     impdp.log                   tmp.ora

dave_2010929.dmp  RAC_hot_database_backup.sh

[oracle@rac1 u01]$ more tmp.ora

 

通过more 命令,我们就可以看到rac pfile 参数的内容,对于RAC 主库,我们不需要做什么修改,只需要添加如下内容:

 

*.log_archive_config='dg_config=(orcl,orcl_st)'

*.log_archive_dest_3='service=orcl_st

*.db_file_name_convert=' /u01/app/oracle/oradata/orcl/datafile','+DATA/orcl/datafile',

' /u01/app/oracle/oradata/orcl/tempfile','+DATA/orcl/tempfile'

*.log_file_name_convert=' /u01/app/oracle/oradata/orcl/datafile', '+DATA/orcl/datafile'

*.standby_file_management=auto

*.fal_server='orcl_st'

orcl1.fal_client='orcl1'

orcl2.fal_client='orcl2'

 

这里要注意的地方:如果之前配置了实例之间归档文件的互相传送,那么这里需要加上db_unique_name 参数:

orcl2.log_archive_dest_2='service=orcl1 db_unique_name=orcl'

orcl1.log_archive_dest_2='service=orcl2 db_unique_name=orcl'

 

不然在启动时会报如下错误:

BAD PARAM ORA-16052: DB_UNIQUE_NAME attribute is required

 

查询Data Guard 的db_unique_name 可以通过v$dagatuard_config视图:

 

SQL> select * from v$dataguard_config;

DB_UNIQUE_NAME

------------------------------

orcl

orcl_st

 

如果之前没有添加,可以通过修改pfile,在用pfile 创建spfile,或者用SQL, 如:

SQL> alter system set log_archive_dest_2='service=orcl1 db_unique_name=orcl' sid='orcl2';

 

关于这些参数的意义,可以参考:

Oracle Data Guard 理论知识


 

一些说明:

(1)    使用ASM 作存储时,datafile 和tempfile 是分别放在两个目录下的,所以在standby 上也单独创建一个tempdata 目录,并在db_file_convert 中作相应的设置。

(2)    在使用ASM的RAC中,注意不要修改db_unique_name 的参数值,因为ASM 存放文件的规则,是按照+diskgroup_name/database_unique_name/file_type/tag_name.file_number.incarnation 这样一个规则存放的,但是第二项database_unique_name 并不是db_name; 如果改变了db_unique_name,则之后创建的数据文件会放到新的目录下,会导致db_file_convert的失败,这一点需要特别注意。

(3)    如果RAC中使用db_create_online_dest_n 系列的参数,要相应调整standby 上的log_file_name_convert 参数。

 

 

第一点里提到ASM 分开存放文件,我们可以用asmcmd 命令连上ASM 验证一下:

 

[oracle@rac2 +ASM]$ export ORACLE_SID=+ASM2

[oracle@rac2 +ASM]$ asmcmd

ASMCMD> ls

DATA/

FLASH_RECOVERY_AREA/

ASMCMD> cd DATA

ASMCMD> ls

ORCL/

ASMCMD> cd ORCL/

ASMCMD> ls

CONTROLFILE/

DATAFILE/

ONLINELOG/

PARAMETERFILE/

TEMPFILE/

spfileorcl.ora

ASMCMD> cd TEMPFILE

ASMCMD> ls

TEMP.283.730181265

 

 

3.5.2 备库的参数文件

 

       备库的初始化文件,在主库的基础上修改一下,把不用的删除掉就可以了。 对于设计到Data Guard的参数,修改一下参数的值就可以了。 最终备库的参数如下:

 

 

 

[oracle@rac3 dbs]$ more initorcl.ora

*.audit_file_dest='/u01/app/oracle/admin/orcl/adump'

*.background_dump_dest='/u01/app/oracle/admin/orcl/bdump'

*.compatible='10.2.0.1.0'

*.control_files='/u01/app/oracle/oradata/orcl/datafile/control01.ctl','/u01/app/oracle/oradata/orcl/

datafile/control02.ctl','/u01/app/oracle/oradata/orcl/datafile/control03.ctl'

*.core_dump_dest='/u01/app/oracle/admin/orcl/cdump'

*.db_block_size=8192

*.db_domain=''

*.db_file_multiblock_read_count=16

*.db_name='orcl'

*.dispatchers='(PROTOCOL=TCP) (SERVICE=orclXDB)'

*.job_queue_processes=10

*.log_archive_dest_1='LOCATION=/u01/arch'

*.log_archive_dest_state_2='ENABLE'

*.open_cursors=300

*.pga_aggregate_target=59768832

*.processes=150

*.remote_login_passwordfile='exclusive'

*.sga_target=179306496

*.undo_management='AUTO'

*.undo_tablespace='UNDOTBS1'

*.user_dump_dest='/u01/app/oracle/admin/orcl/udump'

 

 

*.db_unique_name=orcl_st  -- 注意,这个值要和主库参log_archive_dest_n里设置的一致,不然会报错误:ORA-16047: DGID mismatch between destination

*.log_archive_config='dg_config=(orcl,orcl_st)'

*.log_archive_dest_2='service=orcl1 VALID_FOR=(ALL_LOGFILES,ALL_ROLES) db_unique_name=orcl1'

*.db_file_name_convert='+DATA/orcl/datafile','/u01/app/oracle/oradata/orcl/datafile','+DATA/orcl/tem

pfile','/u01/app/oracle/oradata/orcl/tempfile'

*.log_file_name_convert='+DATA/orcl/onlinelog','/u01/app/oracle/oradata/orcl/datafile',

'+FLASH_RECOVERY_AREA/orcl/onlinelog','/u01/app/oracle/oradata/orcl/datafile'

*.standby_file_management=auto

*.standby_archive_dest='/u01/arch'

*.fal_server='orcl1','orcl2'

*.fal_client='orcl2'

 

 

这里面关于log_file_name_conver 参数:

 

先从主库查看v$logfile:

 

SQL>Select * from v$logfile;

   GROUP# STATUS  TYPE    MEMBER

---------- ------- ------- -----------------------------------------------------

         2         ONLINE  +DATA/orcl/onlinelog/group_2.282.730181191

         2         ONLINE  +FLASH_RECOVERY_AREA/orcl/onlinelog/group_2.262.73018

         1         ONLINE  +DATA/orcl/onlinelog/group_1.281.730181173

         1         ONLINE  +FLASH_RECOVERY_AREA/orcl/onlinelog/group_1.261.73018

         3         ONLINE  +DATA/orcl/onlinelog/group_3.285.730181443

         3         ONLINE  +FLASH_RECOVERY_AREA/orcl/onlinelog/group_3.263.73018

         4         ONLINE  +DATA/orcl/onlinelog/group_4.286.730181451

         4         ONLINE  +FLASH_RECOVERY_AREA/orcl/onlinelog/group_4.264.73018

 

如果这里除了+DATA,还有+FLASH_RECOVERY_AREA, 那么这些redo 都需要在参数里指定进行转换。 不然通过rman ,这些路径也会被复制过去,但是standby上是无法访问这些路径的,所以在做switchover 切换的时候,就会报错。 这点是要注意的地方。

 

 

3.6  RMAN 备份主库并将备份文件传到standby上

      

这里用的是RMAN 复制的方法来搭建standby 环境。 可以参考我的Blog:

       RMAN复制 搭建 物理 Data Gurad 环境

      ​http://www.cndba.cn/Dave/article/1054


备份文件,放在/u01/rmanback 目录下,我们在rac1节点进行备份。 在standby 节点也需要建同样的目录,还需要把备份文件copy到这个目录下。

 

 

[oracle@rac1 bin]$ rman target /

Recovery Manager: Release 10.2.0.1.0 - Production on Fri Oct 8 12:13:07 2010

Copyright (c) 1982, 2005, Oracle.  All rights reserved.

connected to target database: ORCL (DBID=1257961898)

RMAN> RUN {

allocate channel c1 type disk;

allocate channel c2 type disk;

sql 'alter system archive log current';

backup current controlfile for standby format='/u01/rmanbackup/control_%U';

BACKUP FORMAT '/u01/rmanbackup/orcl_%U_%T' skip inaccessible filesperset 5 DATABASE ;

sql 'alter system archive log current';

BACKUP FORMAT '/u01/rmanbackup/arch_%U_%T' skip inaccessible filesperset 5 ARCHIVELOG ALL DELETE INPUT;

release channel c2;

release channel c1;

}

 

SCP 拷贝到 standby 上:

[oracle@rac1 rmanbackup]$ scp * 10.85.10.5://u01/rmanbackup/

 

RMAN备份有一些注意事项,具体参考我的blog:

       RAC RMAN 备份

​http://www.cndba.cn/Dave/article/1001​


 

3.7用之前创建的初始化参数文件将备库启动到nomount 状态:

 

启动监听:

[oracle@rac3 admin]$ lsnrctl start

 

LSNRCTL for Linux: Version 10.2.0.1.0 - Production on 08-OCT-2010 12:41:43

 

Copyright (c) 1991, 2005, Oracle.  All rights reserved.

 

Starting /u01/app/oracle/product/10.2.0/db_1/bin/tnslsnr: please wait...

 

TNSLSNR for Linux: Version 10.2.0.1.0 - Production

System parameter file is /u01/app/oracle/product/10.2.0/db_1/network/admin/listener.ora

Log messages written to /u01/app/oracle/product/10.2.0/db_1/network/log/listener.log

Listening on: (DESCRIPTION=(ADDRESS=(PROTOCOL=tcp)(HOST=10.85.10.5)(PORT=1521)))

 

Connecting to (DESCRIPTION=(ADDRESS=(PROTOCOL=TCP)(HOST=10.85.10.5)(PORT=1521)))

STATUS of the LISTENER

------------------------

Alias                     LISTENER

Version                   TNSLSNR for Linux: Version 10.2.0.1.0 - Production

Start Date                08-OCT-2010 12:41:43

Uptime                    0 days 0 hr. 0 min. 0 sec

Trace Level               off

Security                  ON: Local OS Authentication

SNMP                      OFF

Listener Parameter File   /u01/app/oracle/product/10.2.0/db_1/network/admin/listener.ora

Listener Log File         /u01/app/oracle/product/10.2.0/db_1/network/log/listener.log

Listening Endpoints Summary...

  (DESCRIPTION=(ADDRESS=(PROTOCOL=tcp)(HOST=10.85.10.5)(PORT=1521)))

The listener supports no services

The command completed successfully

 

启动数据库:

 

[oracle@rac3 u01]$ sqlplus /nolog

SQL*Plus: Release 10.2.0.1.0 - Production on Fri Oct 8 12:37:08 2010

Copyright (c) 1982, 2005, Oracle.  All rights reserved.

SQL> conn / as sysdba

Connected to an idle instance.

SQL> startup nomount pfile=?/dbs/initorcl.ora

ORACLE instance started.

Total System Global Area  180355072 bytes

Fixed Size                  1218388 bytes

Variable Size              62916780 bytes

Database Buffers          113246208 bytes

Redo Buffers                2973696 bytes

SQL>

 

3.8 rman还原数据库:

 

[oracle@rac1 admin]$ rman target / auxiliary sys/oracle@orcl_st

 

Recovery Manager: Release 10.2.0.1.0 - Production on Fri Oct 8 13:25:31 2010

 

Copyright (c) 1982, 2005, Oracle.  All rights reserved.

 

connected to target database: ORCL (DBID=1257961898)

connected to auxiliary database: ORCL (not mounted)

 

RMAN> duplicate target database for standby;

Finished Duplicate Db at 09-OCT-10

 

 

 

3.9 检查standby 数据库

 

SQL> select status from v$instance;

 

STATUS

------------

MOUNTED

 

SQL> select name from v$datafile;

 

NAME

--------------------------------------------------------------------------------

/u01/app/oracle/oradata/orcl/datafile/system.276.730181051

/u01/app/oracle/oradata/orcl/datafile/undotbs1.278.730181053

/u01/app/oracle/oradata/orcl/datafile/sysaux.277.730181053

/u01/app/oracle/oradata/orcl/datafile/users.279.730181053

/u01/app/oracle/oradata/orcl/datafile/undotbs2.284.730181347

/u01/app/oracle/oradata/orcl/datafile/tianlesoftware.dbf

/u01/app/oracle/oradata/orcl/datafile/anhuianqing.dbf

 

7 rows selected.

 

SQL> select name from v$tempfile;

 

NAME

--------------------------------------------------------------------------------

/u01/app/oracle/oradata/orcl/tempfile/temp.283.730181265

 

 

将备库启动到mount standby 状态,并启动MRP 进程:

 

SQL> startup nomount;

ORACLE instance started.

Total System Global Area  180355072 bytes

Fixed Size                  1218388 bytes

Variable Size              62916780 bytes

Database Buffers          113246208 bytes

Redo Buffers                2973696 bytes

 

SQL> alter database mount standby database;

Database altered.

 

SQL> recover managed standby database disconnect from session;

Media recovery complete.

SQL>

 

3.10 添加standby redo log 日志

 

       RAC 每个Redo Thread 都需要创建对应的Standby Redo Log。 创建原则和单实例一样,包括日志文件大小相等,日志组数量要多1组。

 

在RAC里查看联机日志:

 

[oracle@rac2 rmanbackup]$ export ORACLE_SID=orcl2

[oracle@rac2 rmanbackup]$ sqlplus /nolog

 

SQL*Plus: Release 10.2.0.1.0 - Production on Sat Oct 9 03:49:49 2010

Copyright (c) 1982, 2005, Oracle.  All rights reserved.

SQL> conn  / as sysdba;

Connected.

SQL> select thread#,group#,bytes/1024/1024 from v$log;

 

   THREAD#     GROUP# BYTES/1024/1024

---------- ---------- ---------------

         1          1              50

         1          2              50

         2          3              50

         2          4              50

 

从上面的结果看出, RAC 有两个Redo Thread,每个Thread 有两个日志组,每个日志文件大小有50MB,所以要针对每个thread 需要创建3组 Standby Redo Log,大小为50MB。

 

 

Alter database add standby logfile thread 1 group 5 ('/u01/app/oracle/oradata/orcl/datafile/redo_st_05.log') size 50m;

 

Alter database add standby logfile thread 1 group 6 ('/u01/app/oracle/oradata/orcl/datafile/redo_st_06.log') size 50m;

 

Alter database add standby logfile thread 1

 

Alter database add standby logfile thread 2

 

Alter database add standby logfile thread 2 group 9 ('/u01/app/oracle/oradata/orcl/datafile/redo_st_09.log') size 50m;

 

Alter database add standby logfile thread 2 group 10 ('/u01/app/oracle/oradata/orcl/datafile/redo_st_10.log') size 50m;

 

添加完可以用: select * from v$logfile 查看日志情况。

 

 

 

3.11 先停止RAC 实例,然后用之前创建的pfile 启动rac 实例。

 

[oracle@rac1 u01]$ cd /u01/app/oracle/product/crs/bin/

[oracle@rac1 bin]$ srvctl stop database -d orcl

[oracle@rac1 bin]$ crs_stat -t

Name           Type           Target    State     Host

------------------------------------------------------------

ora.orcl.db    application    OFFLINE   OFFLINE

ora....oltp.cs application    OFFLINE   OFFLINE

ora....cl1.srv application    OFFLINE   OFFLINE

ora....cl2.srv application    OFFLINE   OFFLINE

ora....l1.inst application    OFFLINE   OFFLINE

ora....l2.inst application    OFFLINE   OFFLINE

ora....SM1.asm application    ONLINE    ONLINE    rac1

ora....C1.lsnr application    ONLINE    ONLINE    rac1

ora.rac1.gsd   application    ONLINE    ONLINE    rac1

ora.rac1.ons   application    ONLINE    ONLINE    rac1

ora.rac1.vip   application    ONLINE    ONLINE    rac1

ora....SM2.asm application    ONLINE    ONLINE    rac2

ora....C2.lsnr application    ONLINE    ONLINE    rac2

ora.rac2.gsd   application    ONLINE    ONLINE    rac2

ora.rac2.ons   application    ONLINE    ONLINE    rac2

ora.rac2.vip   application    ONLINE    ONLINE    rac2

[oracle@rac1 bin]$ export ORACLE_SID=orcl1

[oracle@rac1 bin]$ sqlplus /nolog

 

SQL*Plus: Release 10.2.0.1.0 - Production on Sat Oct 9 05:27:55 2010

 

Copyright (c) 1982, 2005, Oracle.  All rights reserved.

 

SQL> conn / as sysdba;

Connected to an idle instance.

 

SQL> create spfile from pfile='/u01/tmp.ora';

File created.

 

启动所有节点:

SQL> startup

ORACLE instance started.

Total System Global Area  180355072 bytes

Fixed Size                  1218388 bytes

Variable Size             109054124 bytes

Database Buffers           67108864 bytes

Redo Buffers                2973696 bytes

Database mounted.

Database opened.

这里有遇到了点麻烦,参考:

 

ORA-01677 standby file name convert parameters differ from other instance 错误


 

 

 

3.12 在主库查看日志传送情况

 

SQL> Select dest_name,status,error from v$archive_dest;

 

DEST_NAME            STATUS    ERROR

-------------------- --------- -------------------------------------------------

LOG_ARCHIVE_DEST_1   VALID

LOG_ARCHIVE_DEST_2   VALID

LOG_ARCHIVE_DEST_3   VALID

LOG_ARCHIVE_DEST_4   INACTIVE

LOG_ARCHIVE_DEST_5   INACTIVE

LOG_ARCHIVE_DEST_6   INACTIVE

LOG_ARCHIVE_DEST_7   INACTIVE

LOG_ARCHIVE_DEST_8   INACTIVE

LOG_ARCHIVE_DEST_9   INACTIVE

LOG_ARCHIVE_DEST_10  INACTIVE

 

10 rows selected.

 

两个节点都正常。

 

3.13 验证同步情况

 

在主备库分别切换日志:

 

SQL> alter system switch logfile;

System altered.

 

SQL> select sequence# from v$archived_log;

SEQUENCE#

----------

        15

        16

 

SQL> alter system switch logfile;

 

System altered.

 

SQL> select sequence# from v$archived_log;

 

SEQUENCE#

----------

        17

        18

 

在备库进行验证:

SQL> select sequence#,applied from v$archived_log;

 

 

 SEQUENCE# APP

---------- ---

        13 YES

         4 NO

        14 YES

        15 YES

        16 YES

        18 NO

        16 YES

        17 YES

        18 YES

        19 YES

 

同步成功。 至此RAC 为主库的,备库为单实例的 Oracle 的Data Guard 环境已经搭建完成。

 

 

四.Switchover 切换

 

之前blog上的一篇单实例间切换的例子:

Oracle Data Guard Switchover 切换


 

RAC 环境下,切换Primary 和 Standby 时,只能有一个实例是活动的, 其他实例必须关闭。

 

这里我们关闭rac2节点。

 

SQL> select instance_name from v$instance;

 

INSTANCE_NAME

----------------

orcl2

 

SQL> shutdown immediate

Database closed.

Database dismounted.

ORACLE instance shut down.

SQL>

 

在RAC1 节点将主库切换到备库:

 

SQL> select instance_name from v$instance;

INSTANCE_NAME

----------------

orcl1

SQL> SELECT SWITCHOVER_STATUS FROM V$DATABASE;

 

SWITCHOVER_STATUS

--------------------

SESSIONS ACTIVE

 

SQL> alter database commit to switchover to physical standby with session shutdown;

Database altered.

 

SQL> shutdown immediate;

 

 

将备库切换成主库:

 

SQL> SELECT SWITCHOVER_STATUS FROM V$DATABASE;

 

SWITCHOVER_STATUS

--------------------

TO PRIMARY

 

SQL> ALTER DATABASE COMMIT TO SWITCHOVER TO PRIMARY with session shutdown;

 

SQL> shutdown immediate;

 

 

在rac1(原来的主库)节点上创建standby redo log file:

 

SQL> select thread#,group#,bytes/1024/1024 from v$log;

 

   THREAD#     GROUP# BYTES/1024/1024

---------- ---------- ---------------

         1          1              50

         1          2              50

         2          3              50

         2          4              50

 

SQL> alter database add standby logfile thread 1 group 5 size 50m;

SQL> alter database add standby logfile thread 1 group 6 size 50m;

SQL> alter database add standby logfile thread 1 group 7 size 50m;

SQL> alter database add standby logfile thread 2 group 8 size 50m;

SQL> alter database add standby logfile thread 2 group 9 size 50m;

SQL> alter database add standby logfile thread 2 group 10 size 50m;

 

 

添加之后可以通过v$logfile 视图查看:

SQL> select * from v$logfile;

rows will be truncated

 

 

    GROUP# STATUS  TYPE    MEMBER

---------- ------- ------- -----------------------------------------------------

         2         ONLINE  +DATA/orcl/onlinelog/group_2.282.730181191

         2         ONLINE  +FLASH_RECOVERY_AREA/orcl/onlinelog/group_2.262.73018

         1         ONLINE  +DATA/orcl/onlinelog/group_1.281.730181173

         1         ONLINE  +FLASH_RECOVERY_AREA/orcl/onlinelog/group_1.261.73018

         3         ONLINE  +DATA/orcl/onlinelog/group_3.285.730181443

         3         ONLINE  +FLASH_RECOVERY_AREA/orcl/onlinelog/group_3.263.73018

         4         ONLINE  +DATA/orcl/onlinelog/group_4.286.730181451

         4         ONLINE  +FLASH_RECOVERY_AREA/orcl/onlinelog/group_4.264.73018

         5         STANDBY +DATA/orcl/onlinelog/group_5.292.731930683

         5         STANDBY +FLASH_RECOVERY_AREA/orcl/onlinelog/group_5.268.73193

 

 

Standby 日志添加完之后,就可以启动实例了。 同样要注意的是, 如果standby 是RAC 环境, MRP 只能在一个实例上执行,这和RAC的恢复操作一样,而其他实例只能运行RFS。

 

 

这种切换的意义并不大,RAC 本身就是一个高可用性的系统,它有多个节点可以规避宕机的风险。 RAC + 逻辑standby 这种用法还是比较常见。 我们公司目前也是用这种搭配方法,逻辑standby 用来做报表数据库。

 

       这个实验捣鼓了3天的时间,从十一放假回来就开始捣鼓。 本本上跑了三个虚拟机,4G 的内存也是很吃紧, RAC 在家里跑不起来,启动之后总有一个节点会宕机,看了log也是和网络有点什么关系。 只能在公司里才能正常使用。 所以都是上班时间去公司捣鼓这些东西。 今天下班之前总算折腾完了。 

 

结束语: 路漫漫其修远兮,吾将上下而求索!