默认情况下,我们可以在4个级别分别设定mysql的字符集和校验规则,分别是server、database、table和column。实际上,我们甚至还可以单独对一串字符串设定其字符集和校验规则。下面就分别来对四个级别的设定说明一下:

server:

在启动mysql服务的时候,可以指定mysql server的字符集和校验规则,通过如下方式:

mysqld –character-set-server=latin1 –collation-server=latin1_swedish_ci

如果不亲自指定它们,那么mysql就会使用默认值。一般是latin1和latin1_swedish_ci。当然这个默认值是可以修改的,但是方法只有一种,那就是重编译源代码。采用如下方式:

./configure –with-charset=gbk –with-collation=gbk_bin

如何查询当前的server的字符集和校验规则的值,可以查看系统参数character_set_server和collation_server:

mysql> show variables like ‘character_set_server%’;

+———————-+——–+

| Variable_name        | Value  |

+———————-+——–+

| character_set_server | latin1 |

+———————-+——–+

1 row in set (0.00 sec)

mysql> show variables like ‘collation_server%’;

+——————+——————-+

| Variable_name    | Value             |

+——————+——————-+

| collation_server | latin1_swedish_ci |

+——————+——————-+

1 row in set (0.00 sec)

server的字符集和校验规则的唯一作用就是,当database的字符集和校验规则没有指定的时候,就默认使用server的对应值。

database:

我们在创建和修改数据库的时候,可以指定其字符集和校验规则:

CREATE DATABASE db_name

[[DEFAULT] CHARACTER SET charset_name]

[[DEFAULT] COLLATE collation_name];

ALTER DATABASE db_name

[[DEFAULT] CHARACTER SET charset_name]

[[DEFAULT] COLLATE collation_name];

对应查看当前数据库的字符集和校验规则的系统参数是’character_set_database’和’collation_database’,如下:

mysql> show variables like ‘character_set_database’;

+————————+——-+

| Variable_name          | Value |

+————————+——-+

| character_set_database | gbk   |

+————————+——-+

1 row in set (0.00 sec)

mysql> show variables like ‘collation_database’;

+——————–+———+

| Variable_name      | Value   |

+——————–+———+

| collation_database | gbk_bin |

+——————–+———+

1 row in set (0.00 sec)

数据库的字符集和校验规则的作用有二,其一是当没有在表级别知道它们,那么默认就使用数据库基本的值;其二是在“load data infile”时也起到了作用。

table:

在创建表或者修改表结构的时候,我们可以通过如下方式指定这个表的字符集和校验规则:

CREATE TABLE tbl_name (column_list)

[[DEFAULT] CHARACTER SET charset_name] [COLLATE collation_name]]

ALTER TABLE tbl_name

[[DEFAULT] CHARACTER SET charset_name] [COLLATE collation_name]

column:

具体的表的具体的某个字段,我们也可以指定其字符集和校验规则,如下:

col_name {CHAR | VARCHAR | TEXT} (col_length)

[CHARACTER SET charset_name] [COLLATE collation_name]

那么,这四个级别的字符集和校验规则的指定(级别高低server>database>table>column),mysql最终以何种形式来存储和显示字符串的呢?

1、本级别中,如果同时指定character set和collate,那么就使用指定的值;

2、本级别中,只指定character set而没有指定collate,那么就使用指定的character set值和其对应的默认的collation值;

3、本级别中,只指定collate而没有指定character set,那么就使用指定的collation值和其所对应的character set值;

4、本级别中,都没有指定这2个值,那么默认就使用上一级别的对应的值。

国家字符集:

mysql中国家字符集的概念,其表示使用预先定义的字符集,在mysql5.1中使用utf8作为其预先的定义的字符集。

因此,下面几种类型的定义,其实是等效的:

CHAR(10) CHARACTER SET utf8

NATIONAL CHARACTER(10)

NCHAR(10)

下面几种类型也是等效的:

VARCHAR(10) CHARACTER SET utf8

NATIONAL VARCHAR(10)

NCHAR VARCHAR(10)

NATIONAL CHARACTER VARYING(10)

NATIONAL CHAR VARYING(10)