作者:瀚高PG实验室 (Highgo PG Lab)-瀚高大李

PostgreSQL是世界上功能最强大的开源数据库,在国内得到了越来越多机构和开发者的青睐和应用。随着PostgreSQL的应用越来越广泛,Oracle向PostgreSQL数据库的数据迁移需求也越来越多。数据库之间数据迁移的时候,首先是迁移数据,然后就是SQL、存储过程、序列等程序中不同的数据库中数据的使用方式的转换。下面根据自己的理解和测试,写了一些SQL以及数据库对象转换方面的文章,不足之处,尚请多多指教。

1、regexp_replace

regexp_replace是使用正则表达式进行替换的函数。源字符串里面符合正则表达式的,替换成目标字符串。Oracle和PostgreSQL都支持regexp_replace,但是参数有些不同。

Oracle的regexp_replace共有六个参数。分别表示源字符串,正则表达式,目标字符串,开始位置(默认为1),替换第几个匹配(默认全部)和一个flg值('i':大小写不敏感 ‘c’:大小写敏感 'n':点号,不匹配换行符号 'm‘:多行模式 'x':扩展模式,忽略正则表达式中的空白字符)。

PostgreSQL中的regexp_replace只有四个参数,分别表示源字符串,正则表达式,目标字符串,替换规则(默认只替换第一个。当替换规则为'g'的时候代表全部替换)。

PostgreSQL中的regexp_replace的功能没有Oracle的regexp_replace的功能强。有些比较复杂的替换,只能自己通过函数实现。

Oracle regexp_replace

SQL> select regexp_replace('abc123xyz888', '[0-9]+') from  dual;

REGEXP
------
abcxyz

SQL> select regexp_replace('abc123xyz888', '[0-9]+', 'ZZZ') from  dual;

REGEXP_REPLA
------------
abcZZZxyzZZZ

SQL> select regexp_replace('abc123xyz888', '[0-9]+', 'ZZZ', 8) from  dual;

REGEXP_REPLA
------------
abc123xyzZZZ

SQL> select regexp_replace('abc123xyz888', '[0-9]+', 'ZZZ', 1, 2) from  dual;

REGEXP_REPLA
------------
abc123xyzZZZ

SQL> select regexp_replace('abc123xyz888', '[a-c]+', 'ZZZ', 1, 1, 'i')  from  dual;

REGEXP_REPLA
------------
ZZZ123xyz888

SQL> select regexp_replace('abc123xyz888', '[A-C]+', 'ZZZ', 1, 1, 'i')  from  dual;

REGEXP_REPLA
------------
ZZZ123xyz888

SQL> select regexp_replace('abc123xyz888', '[A-C]+', 'ZZZ', 1, 1, 'c')  from  dual;

REGEXP_REPLA
------------
abc123xyz888

PostgreSQL regexp_replace

postgres=# select regexp_replace('abc123xyz888', '[0-9]+') ;
错误:  函数 regexp_replace(unknown, unknown) 不存在
第1行select regexp_replace('abc123xyz888', '[0-9]+') ;
            ^
提示:  没有匹配指定名称和参数类型的函数. 您也许需要增加明确的类型转换.
postgres=#  select regexp_replace('abc123xyz888', '[0-9]+', 'ZZZ');
 regexp_replace
----------------
 abcZZZxyz888
(1 行记录)

postgres=#  select regexp_replace('abc123xyz888', '[0-9]+', 'ZZZ', 'g');
 regexp_replace
----------------
 abcZZZxyzZZZ
(1 行记录)

2、regexp_substr

regexp_substr是Oracle的使用正则表达式进行字符串截取的函数。PostgreSQL中的substring函数中可以实现它的简单功能,但是没有Oracle的功能强。如果需要实现它的复杂功能,需要自己使用函数实现。
Oracle的regexp_substr函数有五个参数。分别表示源字符串,正则表达式,开始位置(默认为1),截取第几个匹配(默认第一个)和一个flg值('i':大小写不敏感 ‘c’:大小写敏感 'n':点号,不匹配换行符号 'm‘:多行模式 'x':扩展模式,忽略正则表达式中的空白字符)。
PostgreSQL中的regexp_substr只有三个参数,分别表示源字符串,正则表达式,逃匿符。

Oracle regexp_substr

SQL> select regexp_substr('abc123abc888', '[a-c]+')  from  dual;

REG
---
abc

SQL> select regexp_substr('abc123abc888', '[a-c]+', 2)  from  dual;

RE
--
bc

SQL> select regexp_substr('abc123abc888', '[a-c]+', 5)  from  dual;

REG
---
abc

SQL> select regexp_substr('abc123abc888', '[a-c]+', 1, 2)  from  dual;

REG
---
abc

SQL> select regexp_substr('abc123abc888', '[A-C]+', 1, 1)  from  dual;

R
-

SQL> select regexp_substr('abc123abc888', '[A-C]+', 1, 1, 'i')  from  dual;

REG
---
abc

SQL> select regexp_substr('abc123abc888', '[A-C]+', 1, 1, 'c')  from  dual;

R
-

PostgreSQL substring

postgres=# select substring('abc123abc888', '[a-c]+') ;
 substring
-----------
 abc
(1 行记录)

postgres=# select substring('abc123abc888' from  '[a-c]+') ;
 substring
-----------
 abc
(1 行记录)

postgres=# select substring('Thomas' , '%#"o_a#"%' ,'#');
 substring
-----------
 oma
(1 行记录)

postgres=# select substring('Thomas' from '%#"o_a#"%' for '#');
 substring
-----------
 oma
(1 行记录)

3、regexp_instr

regexp_instr是Oracle的一个搜索字符串中符合表达式的字串位置的一个函数。在PostgreSQL中没有对应的函数,需要自己写函数实现它。
最简单的功能,可以使用position函数和substring函数来模拟实现。

Oracle regexp_instr

SQL> select regexp_instr('abc123abc156', '[1-2]+')  from  dual;

REGEXP_INSTR('ABC123ABC156','[1-2]+')
-------------------------------------
                                    4

SQL> select regexp_instr('abc123abc156', '[1-2]+', 7)  from  dual;

REGEXP_INSTR('ABC123ABC156','[1-2]+',7)
---------------------------------------
                                     10

SQL> select regexp_instr('abc123abc156', '[1-2]+', 1, 2)  from  dual;

REGEXP_INSTR('ABC123ABC156','[1-2]+',1,2)
-----------------------------------------
                                       10

SQL> select regexp_instr('abc123abc156', '[1-2]+', 1, 1, 0)  from  dual;

REGEXP_INSTR('ABC123ABC156','[1-2]+',1,1,0)
-------------------------------------------
                                          4

SQL> select regexp_instr('abc123abc156', '[1-2]+', 1, 1, 1)  from  dual;

REGEXP_INSTR('ABC123ABC156','[1-2]+',1,1,1)
-------------------------------------------
                                          6

SQL> select regexp_instr('abc123abc156', '[A-C]+', 1, 2, 0, 'i')  from  dual;

REGEXP_INSTR('ABC123ABC156','[A-C]+',1,2,0,'I')
-----------------------------------------------
                                              7

SQL> select regexp_instr('abc123abc156', '[A-C]+', 1, 2, 0, 'c')  from  dual;

REGEXP_INSTR('ABC123ABC156','[A-C]+',1,2,0,'C')
-----------------------------------------------
                                              0

PostgreSQL position substring

postgres=# select position(substring('abc123abc156' from '[1-2]+') in 'abc123abc156');
 position
----------
        4
(1 行记录)


postgres=# select 7 - 1 + position(substring(substring('abc123AC158',7) from '[1-2]+') in 'abc123AC158');
 ?column?
----------
       10
(1 行记录)

4、regexp_like

regexp_like是Oracle的一个检索正则表达式条件的一个函数,只能用在条件判断部分。在PostgreSQL中没有对应的函数,需要自己写函数实现它。
最简单的功能,可以简单的使用substring和length函数来模拟。

Oracle regexp_like

SQL> select * from o_test;

        ID NAME       AGE
---------- ---------- ----------
         1 James1234  20
         2 De Haan    20
         2 Greenberg  20
         2 TomLiu     20

SQL> select * from o_test where regexp_like(name, '([aeiou])\1');

        ID NAME       AGE
---------- ---------- ----------
         2 De Haan    20
         2 Greenberg  20

SQL> select * from o_test where regexp_like(name, '([AEIOU])\1');

未选定行

SQL> select * from o_test where regexp_like(name, '([AEIOU])\1', 'i');

        ID NAME       AGE
---------- ---------- ----------
         2 De Haan    20
         2 Greenberg  20

SQL> select * from o_test where regexp_like(name, '([AEIOU])\1', 'c');

未选定行

PostgreSQL length substring

postgres=# select * from p_test where length(substring(name, '([aeiou])\1')) > 0;
 id |   name    | age
----+-----------+-----
  2 | De Haan   | 20
  3 | Greenberg | 20
(2 行记录)

postgres=# select * from p_test where length(substring(name, '([AEIOU])\1')) > 0;
 id | name | age
----+------+-----
(0 行记录)

postgres=# select * from p_test where length(substring(name, '([AEIOUaeiou])\1')) > 0;
 id |   name    | age
----+-----------+-----
  2 | De Haan   | 20
  3 | Greenberg | 20
(2 行记录)