首页 理论教育计算机信息的表示与存储方式

计算机信息的表示与存储方式

【摘要】:位权简称“权”,是指一个数制中,各位数字符号所表示的数值等于该数字符号值乘以一个与该数字符号所处位置有关的常数。字符编码就是规定用二进制数表示文字和符号的方法。规定两个字节的最高位用来区分ASCII码。3)计算机中数据的存储单位位:用字符“b”表示,是计算机中存储数据的最小单位。

1.任务描述

掌握计算机中信息的表示及存储方式。

2.任务展开

1)计算机中使用的数制

(1)常用数制。

数制是以表示数值所用的数字符号的个数来命名的,并按一定进位规则进行计数的方法。数制所用的数字符号的个数称为数制的基,数制中每一个数值所具有的值(Rk)称为数制的位权。对于R进制数,有数字符号0,1,2,…,R-1,共R个,基数是R,k是指数。进位规则是逢R进1。表1-2所示为常见数制。

表1-2 常见数制

续表

(2)数制转换。

无论使用哪一种数制,数值的表示都包含两个基本要素:基数和位权。

基数是一个数制允许选用的数字符号的个数,一般而言,R进制数的基数为R,可供选用的数字符号有R个,分别为0~R-1,每个数位计满R就向其高位进1,即“逢R进一”。

位权简称“权”,是指一个数制中,各位数字符号所表示的数值等于该数字符号值乘以一个与该数字符号所处位置有关的常数。位权的大小是以基数为底,数字符号所处位置的序号为指数的整数次幂。各数字符号所处位置的序号计法为:以小数点为基准,整数部分自右向左依次为0,1…递增,小数部分自左向右依次为-1,-2…递减。

二进制转换为十进制

按权展开后,相加即可。

例1-1 (1101.011)2=1×23+1×22+0×21+1×20+0×2-1+1×2-2+1×2-3=(13.375)10

②十进制转换为二进制。

整数部分:采用除2取余法,且除到商为0为止;按从下往上顺序排列余数即可得到结果。先取余数低位,后取余数高位。

小数部分:采用乘2取整法,直到小数部分为0或达到所要求精度为止(小数部分可能永远不会为0),最先得到的整数排在最高位。

例1-2 (303)10=( )2

解答如图1-11所示。

例1-3 (0.687 5)10=( )2

解答如图1-12所示。

③二、八、十六进制之间的相互转换。

由于二、八、十六进制之间存在这样一种关系——23=8,24=16,所以,每位八进制数相当于3位二进制数,每位十六进制数相当于4位二进制数,在转换时,位组划分是以小数点为中心向左、右两边延伸,中间的0不能省略,两头位数不足时可补0,如表1-3所示。

图1-11 例1-2解答

图1-12 例1-3解答

表1-3 十进制、二进制、八进制、十六进制对应表

2)字符编码

(1)ASCII码

字符是计算机中使用最多的信息形式之一,在计算机中,要为每个字符指定一个确定的二进制编码,作为识别与使用这些字符的依据。字符编码就是规定用二进制数表示文字和符号的方法。在西文领域,目前普遍采用的字符编码是ASCII码(美国标准信息交换码),其有7位版本和8位版本两种。

目前,国际上通用的且使用最广泛的字符有:十进制数字符号0~9,大、小写的英文字母,各种运算符、标点符号等,这些字符的个数不超过128个。由于需要编码的字符不超过128个,因此,用7位二进制数就可以对这些字符进行编码。7位ASCII码也称为标准ASCII码,如表1-4所示。

ASCII码是唯一的,没有两个字符的ASCII码值是一样的。7位ASCII码的常用码值如下:

32~126号(共95个)是字符(32号是空格),其中48~57号为0~9十个阿拉伯数字,65~90号为26个大写英文字母,97~122号为26个小写英文字母。

表1-4 7位ASCII码

8位ASCII码是指一个字符用8位二进制数来表示,可表示256个字符(0~255)。

(2)汉字编码。

每个国家使用计算机都要处理本国语言。1980年我国颁布了《信息交换用汉字编码字符集-基本集》,即国家标准GB 2312—1980。其共收集汉字6 763个,分为两级。第一级3 755个汉字,属常用汉字,按汉字拼音字母顺序排列。第二级3 008个汉字,属次常用汉字,按部首排列。

1995年我国又颁布了《汉字编码扩展规范》(GBK)。GBK与GB 2312—1980国家标准所对应的内码标准兼容,同时在字汇一级支持ISO/IEC 10646—1和GB 13000—1的全部中、日、韩(CJK)汉字,共计20 902字。

①汉字外部码。

汉字外部码又称汉字输入码,是指从键盘上输入汉字时采用的编码。目前广泛使用的汉字输入码有很多种。

a.以汉字读音为基础的拼音码,如全拼输入法、双拼输入法、词汇输入法、智能ABC输入法等;

b.以汉字字形为基础的字形码,如五笔字型输入法;

c.音形码,综合拼音码和字型码的特点,如自然码等;

d.数字码,如区位码、电报码、内码等。

不同的汉字输入方法有不同的外码,但内码只能有一个。好的输入方法应具有规则简单、操作方便、容易记忆、重码率低、速度快等特点。

②汉字国标码。

GB 2312—1980编码简称国标码。由于汉字数量大,无法用一个字节进行编码,因此使用两个字节对汉字进行编码。规定两个字节的最高位用来区分ASCII码。这样国标码用两个字节的低7位对汉字进行编码。

③汉字字形码。

汉字字形码又称汉字字模,用于汉字的输出。汉字的字形通常采用点阵的方式产生。汉字点阵有16×16点阵、32×32点阵、64×64点阵,点阵不同,汉字字形码的长度也不同。点阵数越大,字形质量越高,汉字字形码占用的字节数越多。

3)计算机中数据的存储单位

(1)位(bit):用字符“b”表示,是计算机中存储数据的最小单位。一个二进制数(0或1)为1位。

(2)字节(byte):1个字节等于8个二进制位,通常用字符“B”表示。字节是数据处理和存储的基本单位,如一个英文字母占一个字节,一个汉字占两个字节。

此外,计算机中还经常使用字符KB、MB、GB或TB表示存储设备的容量或文件的大小,它们之间的换算关系如下:

1 B=8 b

1 KB=1 024 B

1 MB=1 024 KB=1 024×1 024 B

1 GB=1 024 MB=1 024×1 024×1 024 B

1 TB=1 024 GB=1 024×1 024×1 024×1 024 B