Postgresql 常用的字符数据类型的有char、varchar和text,其中 char 固定长度类型, varchar 和 text 是可变长度类型。这三种类型在进行比较时,会进行隐含的类型转换。这种转换会导致索引可能无法使用,影响SQL的执行计划。以下以例子的形式展示Postgresql 不同字符数据类型间的转换规则。

一、创建测试数据

create table test_char(id char(9),desc_info text);
create table test_varchar(id varchar(9),desc_info text);
create table test_text(id text,desc_info text);

insert into test_char select generate_series(100001,200000),repeat('a',100);
insert into test_varchar select generate_series(100001,200000),repeat('a',100);
insert into test_text select generate_series(100001,200000),repeat('a',100);

create index ind_test_char on test_char(id);
create index ind_test_varchar on test_varchar(id);
create index ind_test_text on test_text(id);

analyze test_char;
analyze test_varchar;
analyze test_text;

二、创建SQL游标

prepare test_char_bind_varchar(varchar) as select * from test_char where id=$1;
prepare test_char_bind_text(text) as select * from test_char where id=$1;

prepare test_varchar_bind_char(char) as select * from test_varchar where id=$1;
prepare test_text_bind_char(char) as select * from test_text where id=$1;

prepare test_varchar_bind_text(text) as select * from test_varchar where id=$1;
prepare test_text_bind_varchar(varchar) as select * from test_text where id=$1;

三、Postgresql字符类型的隐含转换规则

1、对于 varchar 与 char 比较,默认是 varchar 转成 char。

例子2,由于等式左边发生了类型转换,无法使用索引。

例子1:
testdb=# explain execute test_char_bind_varchar('123456');
QUERY PLAN                                   
---------------------------------------------------------------------------------
Index Scan using ind_test_char on test_char  (cost=0.42..8.44 rows=1 width=111)
Index Cond: (id = '123456'::bpchar)
(2 rows)

例子2:等式左边发生类型转换,无法使用索引
testdb=# explain execute test_varchar_bind_char('123456');
QUERY PLAN                           
-----------------------------------------------------------------
Seq Scan on test_varchar  (cost=0.00..2975.00 rows=1 width=108)
Filter: ((id)::bpchar = '123456'::bpchar)
(2 rows)

2、对于 text 与 char 比较,默认是 char 转成 text 。

例子3,由于等式左边发生了类型转换,无法使用索引。

例子3:等式左边发生类型转换,无法使用索引。
testdb=# explain execute test_char_bind_text('123456');
QUERY PLAN                          
----------------------------------------------------------------
Seq Scan on test_char  (cost=0.00..3225.00 rows=500 width=111)
Filter: ((id)::text = '123456'::text)
(2 rows)

例子4:
testdb=# explain execute test_text_bind_char('123456');
QUERY PLAN                                   
---------------------------------------------------------------------------------
Index Scan using ind_test_text on test_text  (cost=0.29..8.31 rows=1 width=108)
Index Cond: (id = '123456'::text)
(2 rows)

3、对于 varchar 与 text 比较,默认是 varchar 转成 text ,但二者的转换不影响索引的使用。

testdb=# explain execute test_varchar_bind_text('123456');
QUERY PLAN                                      
---------------------------------------------------------------------------------------
Index Scan using ind_test_varchar on test_varchar  (cost=0.29..8.31 rows=1 width=108)
Index Cond: ((id)::text = '123456'::text)
(2 rows)

testdb=# explain execute test_text_bind_varchar('123456');
QUERY PLAN                                   
---------------------------------------------------------------------------------
Index Scan using ind_test_text on test_text  (cost=0.29..8.31 rows=1 width=108)
Index Cond: (id = '123456'::text)
(2 rows)

PG 字符类型数据转换规则:varchar -> char -> text

四、KingbaseES 类型转换及优化

用过Oracle的人都知道,char与varchar 之间的比较不会因为类型不同而无法使用索引,Kingbase在特性上向Oracle靠拢,为用户从Oracle向KingbaseES迁移提供便利。KingbaseES 继承Postgresql 的特性,同时通过代码的优化,避免了char与varchar和text之间比较导致的转换而无法使用索引的情况。以下的例子在KingbaseES V8R6 版本进行过实际验证。

1、对于 varchar 与 char 比较,同样是 varchar 转成 char。

kingbase 针对这个问题,进行了特殊的优化处理,即使等式左边的varchar发生了类型转换,也不影响索引的使用,如:例子6。

例子5:
testdb=# explain execute test_char_bind_varchar('123456');
QUERY PLAN                                   
---------------------------------------------------------------------------------
Index Scan using ind_test_char on test_char  (cost=0.42..8.44 rows=1 width=111)
Index Cond: (id = '123456'::bpchar)
(2 rows)

例子6:不会因为等式左边发生类型转换而无法使用索引。
testdb=# explain execute test_varchar_bind_char('123456');
QUERY PLAN                                      
---------------------------------------------------------------------------------------
Index Scan using ind_test_varchar on test_varchar  (cost=0.29..8.31 rows=1 width=108)
Index Cond: ((id)::text = '123456'::text)
(2 rows)

2、对于 text 与 char 比较,kingbase 进行了特殊的优化处理,使得转换发生在等式的右边,不影响索引的使用。

例子7:
testdb=# explain execute test_char_bind_text('123456');
QUERY PLAN                                   
---------------------------------------------------------------------------------
Index Scan using ind_test_char on test_char  (cost=0.42..8.44 rows=1 width=111)
Index Cond: (id = '123456'::bpchar)
(2 rows)

例子8:
testdb=# explain execute test_text_bind_char('123456');
QUERY PLAN                                   
---------------------------------------------------------------------------------
Index Scan using ind_test_text on test_text  (cost=0.29..8.31 rows=1 width=108)
Index Cond: (id = '123456'::text)
(2 rows)

3、对于 varchar 与 text 比较,默认是 varchar 转成 text 。与PG一样,二者的转换不影响索引的使用。

test=# explain execute test_varchar_bind_text('123456');
QUERY PLAN                                      
---------------------------------------------------------------------------------------
Index Scan using ind_test_varchar on test_varchar  (cost=0.29..8.31 rows=1 width=108)
Index Cond: ((id)::text = '123456'::text)
(2 rows)

test=# explain execute test_text_bind_varchar('123456');
QUERY PLAN                                   
---------------------------------------------------------------------------------
Index Scan using ind_test_text on test_text  (cost=0.29..8.31 rows=1 width=108)
Index Cond: (id = '123456'::text)
(2 rows)

 

Tips:以上例子是基于Postgresql 12.3 和 KingbaseES V8R6版本测试的结果。