PYTHON 之 字符编码的区别与介绍

2023-05-23,,

理解字符编码的历史与使用原因

1、计算机只能认0与1。
2、通过0与1,二进制数,计算机能很容易识别出各种数字。
3、为了能让计算机识别各种字符,美国人制定了ASCII码,能识别出127种字母与特殊字符,只需使用一个字节。
3、因为ASCII码不支持中文,在1980设计出gb2312 ,收录了7445个汉字。
4、到了1995年 设计出BGK1.0 收录了2万多个汉字。
5、到了2000年,设置出GB18030 收录了2万7千多个汉字。
6、到了不个不知道什么年份的时候,国际组织为了统一全世界的字符,设置出unicode ,使用了2个字节
7、后面又设置出现在的utf-8可变长字符编码,为了解决英文字符只占用一字节的大小(不要浪费空间吗),此时的的英文是:1byte, 中文:3bytes

关于python2的版本是不支持中文字符的,而只支持ASCII码,意思是只支持英文或特殊字符的显示。

为了能使python2能显示中文,必须在代码前加上以下字符:

备注:PYTHON3默认直接使用的字符编码就是UTF-8,可直接使用中文字符