在mysql中,字符集支持(Character Set Support):字符集(Character set)和排序方式(Collation)。
对于字符集的支持细化到四个层次:
服务器(server),数据库(database),数据表(table)和连接(connection)。
1,MySQL默认字符集
MySQL对于字符集的指定可以细化到一个数据库,一张表,一列。
但是,传统的程序在创建数据库和数据表时并需要这么复杂的配置,它们用的是默认的配置。
默认的配置从何而来?
1,编译MySQL 时,指定了一个默认的字符集,这个字符集是 latin1;
2,安装MySQL 时,可以在配置文件 (my.ini) 中指定一个默认的的字符集,如果没指定,这个值继承自编译时指定的;
3,启动mysqld 时,可以在命令行参数中指定一个默认的的字符集,如果没指定,这个值继承自配置文件中的配置,此时 character_set_server 被设定为这个默认的字符集;
4,当创建一个新的数据库时,除非明确指定,这个数据库的字符集被缺省设定为character_set_server;
5,当选定了一个数据库时,character_set_database 被设定为这个数据库默认的字符集;
6,在这个数据库里创建一张表时,表默认的字符集被设定为 character_set_database,也就是这个数据库默认的字符集;
7,当在表内设置一栏时,除非明确指定,否则此栏缺省的字符集就是表默认的字符集;
总结:
如果什么地方都不修改,那么所有的数据库的所有表的所有栏位的都用 latin1 存储,不过如果安装 MySQL,一般都会选择多语言支持,即安装程序会自动在配置文件中把
default_character_set 设置为 UTF-8,这保证了缺省情况下,所有的数据库的所有表的所有栏位的都用 UTF-8 存储。
2,查看默认字符集(默认情况下,mysql的字符集是latin1(ISO_8859_1)
通常,查看系统的字符集和排序方式的设定,命令如下:
mysql> SHOW VARIABLES LIKE 'character%';
+--------------------------+---------------------------------+
| Variable_name | Value |
+--------------------------+---------------------------------+
| character_set_client | latin1 |
| character_set_connection | latin1 |
| character_set_database | latin1 |
| character_set_filesystem | binary |
| character_set_results | latin1 |
| character_set_server | latin1 |
| character_set_system | utf8 |
| character_sets_dir | D:"mysql-5.0.37"share"charsets" |
+--------------------------+---------------------------------+
mysql> SHOW VARIABLES LIKE 'collation_%';
+----------------------+-----------------+
| Variable_name | Value |
+----------------------+-----------------+
| collation_connection | utf8_general_ci |
| collation_database | utf8_general_ci |
| collation_server | utf8_general_ci |
+----------------------+-----------------+
3,修改默认字符集
1,修改mysql的my.ini文件中的字符集键值,
例如:
重启mysql,使修改生效:
使用 mysql> SHOW VARIABLES LIKE 'character%';查看,数据库编码已修改为:utf8。
2,使用mysql命令修改默认的字符集
mysql> SET character_set_client = utf8 ;
mysql> SET character_set_connection = utf8 ;
mysql> SET character_set_database = utf8 ;
mysql> SET character_set_results = utf8 ;
mysql> SET character_set_server = utf8 ;
mysql> SET collation_connection = utf8 ;
mysql> SET collation_database = utf8 ;
mysql> SET collation_server = utf8 ;
一般就算设置了表的默认字符集为utf8并且通过UTF-8编码发送查询,你会发现存入数据库的仍然是乱码。问题就出在这个connection连接层上。
解决方法:发送查询前执行:
它相当于下面的三句指令:
总结:
1,正确的设定数据库编码.MySQL4.0以下版本的字符集总是默认ISO8859-1,MySQL4.1及以上版本在安装时会要求选择。
如果准备使用UTF- 8,那么在创建数据库时,就要指定好UTF-8。
2,正确的设定数据库connection编码.设置好数据库的编码后,在连接数据库时,应指定connection的编码,比如使用jdbc连接时,指定连接为utf8方式。