首页 理论教育ASCII码表及扩展字符集的表示方法

ASCII码表及扩展字符集的表示方法

【摘要】:目前使用最广泛的西文字符集代码表是美国制定的ASCII码表,其全称是“美国信息交换标准代码”。从表中可以看出,一个字节的编码对应一个字符,最高位在计算机内部一般为“0”,故ASCII码是7位的编码,共可表示128个字符。于是人们借鉴ASCII码的设计思想,创造了使用8位二进制数表示字符的扩展字符集,这样就可以使用256种数字代号表示更多的字符。在扩展字符集中,从0到127的代码与ASCII码保持兼容,从128到255的代码用于表示其他的字符和符号。

西文包含拉丁字母、数字、标点符号和一些特殊符号,统称为“字符”(character)。所有字符的集合称作“字符集”。字符集中每一个字符对应一个编码,构成编码表。

显然编码表是用二进制表示的,人们理解起来很困难。为保证人和计算机之间能进行正确的信息交换,人们编制了统一的信息交换代码。目前使用最广泛的(但并不是唯一的)西文字符集代码表是美国制定的ASCII码表,其全称是“美国信息交换标准代码”(American Standard Code for Information Interchange)。

表1.3即为ASCII码表,表头中的“高”字代表一个字节的高4位(b7~b4),“低”字代表该字节的低4位(b3~b0)。从表中可以看出,一个字节的编码对应一个字符,最高位在计算机内部一般为“0”,故ASCII码是7位的编码,共可表示128个字符。

表中的前2列字符和最后一个字符(DEL)称为“控制字符”,在传输、打印或显示输出时起控制作用;剩下的95个字符是可打印(显示)的字符,并可在键盘上找到对应的按键。(www.chuimin.cn)

表1.3 ASCII码表

显然美国顺利解决了字符的问题,可是欧洲各国还没有,例如法文中就有许多英文中没有的字符,因此ASCII码不能帮助欧洲人解决编码问题。于是人们借鉴ASCII码的设计思想,创造了使用8位二进制数表示字符的扩展字符集,这样就可以使用256种数字代号表示更多的字符。在扩展字符集中,从0到127的代码与ASCII码保持兼容,从128到255的代码用于表示其他的字符和符号。由于不同文字有各自不同的字符,于是人们为此制定了大量不同的编码表,其中国际标准化组织的ISO 8859标准得到了广泛的使用。