MySQL字符集常见问题的解决方法

字符集的设置和修改
服务器君一共花费了1608.793 ms进行了5次数据库查询,努力地为您提供了这个页面。
试试阅读模式?希望听取您的建议

在Google中搜索“mysql 乱码”,可以查到“1,550,000”条结果;搜索“jsp 乱码”,可以查到“1,450,000”条结果,当然JSP乱码不一定就是MySQL乱码,但多数情况是编码问题(可能是页面编码、数据库编码)。可见,编码问题在我们开发过程中是经常出现的,因此对编码的了解、设置和修改就显得及其重要了。

1. MySQL字符集和校对规则

我们都知道,字符集就是一套文字符号及其编码、比较规则的集合,因为计算机只认识二进制代码,所有我们必须要有一个转换。

MySQL的字符集包括字符集(Character Set)和校对规则(Collation)两个概念。字符集是用来定义MySQL存储字符串的方式,而校对规则则定义了比较字符串的方式。

字符集和校对规则是一对多的关系,每个字符集至少对应一个校对规则,称为默认校对规则。

查看所有字符集的命令:show character set;

或是查看information_schema.character_sets,可以得到所有的字符集和它的默认的校对规则,它的表结构:desc information_schema.character_sets;

查看字符集的校对规则:show collation like 'GBK%';

校对规则命名约定:以其相关的字符集名开始,通常包括一个语言名,并且以_ci(大小写不敏感)、_cs(大小写敏感)或_bin(二元,即比较是基于字符编码的值而与语言无关)结束。

实验命令:

select case when 'A' COLLATE utf8_general_ci = 'a' COLLATE utf8_general_ci then 'YES' else 'NO' end;(YES)
select case when 'A' COLLATE gbk_chinese_ci = 'a' COLLATE gbk_chinese_ci then 'YES' else 'NO' end;(YES)
select case when 'A' COLLATE gbk_bin = 'a' COLLATE gbk_bin then 'YES' else 'NO' end;(NO)

2. 设置字符集

MySQL的字符集和校对规则有4个级别的默认设置:服务器级、数据库级、表级和字段级。

服务器级:

[mysqld]
default-character-set=utf8
[mysql]
default-character-set=utf8

或是启动时加上参数:mysqld --default-character-set=utf8

或是编译时加上参数:./configure --width-charset=utf8

查看字符集和校对规则:

show variables like 'character_set_server';
show variables like 'collation_server';

数据库级:

查看字符集和校对规则:

show variables like 'character_set_database';
show variables like 'collation_database';

表级:

查看字符集和校对规则:

show create table t \G

3. 简单修改字符集

简单修改只对以后的数据有影响,如果数据库中没有数据或是不想修改以前的数据,可以使用简单修改。

简单修改命令:

alter database character set utf8;
alter table t character set utf8;

个人推荐在创建数据库时明确指定字符集和校对规则,避免受到默认值的影响。

创建数据库时指定:reate database databasename default charset GBK;

创建数据表时指定:

create table tablename(
....
) ENGIND=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin;

4. 完全修改字符集

当数据库中已有数据,想修改数据集,不能通过简单的修改字符集完成,需要先将原数据导出,经过适当调整后重新导入才可完成。 通过七步完成字符集的完全修改(假设原字符集是latin1,想修改成GBK)。

  1. 导出表结构:mysqldump -uroot -p --default-character-set=GBK -d databasename>createdb.sql
    • --default-character-set=GBK 表示设置以什么字符集连接;
    • -d 表示只导出表结构,不导出数据。
  2. 手工修改createdb.sql中表结构定义中的字符集(latin1)为新的字符集(GBK);
  3. 确保数据库中的数据不再更新,导出所有的数据:mysqldump -uroot -p --quick --no-create-info --extended-insert --default-character-set=latin1 databasename>data.sql
    • --quick 该选项用于转储大的表,它强制mysqldump从服务器一次一行地检索表中的行而不是检索所有行,并在输出前将它缓存到内存中;
    • --extended-insert 使用包括几个values的多行insert语法;
    • --no-create-info 不要create table语句;
    • --default-character-set=latin1 表示按照原有的字符集导出所有的数据。
  4. 打开data.sql,将set names latin1修改成set names GBK;
  5. 使用新的字符集创建数据库:create database databasename default charset GBK;
  6. 创建表:mysql -uroot -p databasename < createdb.sql
  7. 导入数据:mysql -uroot -p databasename < data.sql

最后

建议服务器的字符集参数不要修改,而是是创建数据库进加上字符集,特别是在创建表时记得加上,这样做的目的是为了使修改的影响最小化。

本文地址:http://www.nowamagic.net/librarys/veda/detail/137,欢迎访问原出处。

不打个分吗?

转载随意,但请带上本文地址:

http://www.nowamagic.net/librarys/veda/detail/137

如果你认为这篇文章值得更多人阅读,欢迎使用下面的分享功能。
小提示:您可以按快捷键 Ctrl + D,或点此 加入收藏

大家都在看

阅读一百本计算机著作吧,少年

很多人觉得自己技术进步很慢,学习效率低,我觉得一个重要原因是看的书少了。多少是多呢?起码得看3、4、5、6米吧。给个具体的数量,那就100本书吧。很多人知识结构不好而且不系统,因为在特定领域有一个足够量的知识量+足够良好的知识结构,系统化以后就足以应对大量未曾遇到过的问题。

奉劝自学者:构建特定领域的知识结构体系的路径中再也没有比学习该专业的专业课程更好的了。如果我的知识结构体系足以囊括面试官的大部分甚至吞并他的知识结构体系的话,读到他言语中的一个词我们就已经知道他要表达什么,我们可以让他坐“上位”毕竟他是面试官,但是在知识结构体系以及心理上我们就居高临下。

所以,阅读一百本计算机著作吧,少年!

《JavaScript DOM编程艺术(第2版)》 基思(Jeremy Keith) (作者), 桑布尔斯(Jeffrey Sambells) (作者), 魏忠 (合著者), 杨涛 (译者), 王建桥 (译者), 杨晓云 (译者), 等 (译者)

《JavaScript DOM编程艺术(第2版)》内容简介:JavaScript是Web开发中最重要的一门语言,它强大而优美。无论是桌面开发,还是移动应用。JavaScript都是必须掌握的技术。W3C的DOM标准是开发Web应用的基石。已经得到所有现代浏览器的支持,这使得跨平台Web开发成了一件轻松惬意的事。《JavaScript DOM编程艺术(第2版)》是超级畅销书的升级版,由倡导Web标准的领军人物执笔,揭示了前端开发的真谛,是学习JavaScript和DOM开发的必读之作。

更多计算机宝库...