■任务情景小明在使用word进行文档处理时,想到计算机中只有0和1,很疑惑文字、图片等非数值信息在计算机中是怎么存储和处理的呢?■任务分析◆英文字符的编码◆汉字信息的表示◆其他信息的表示■知识准备1.英文字符编码在计算机中,对非数值的文字和其他符号进行处理时,要对文字和符号进行数字化处理,即用二进制编码来表示文字和符号。目前广泛使用的汉字机内码是变形的国标码。汉字的矢量表示法将汉字视为由笔画组成的图形。......
2023-11-18
1.任务描述
掌握计算机中信息的表示及存储方式。
2.任务展开
1)计算机中使用的数制
(1)常用数制。
数制是以表示数值所用的数字符号的个数来命名的,并按一定进位规则进行计数的方法。数制所用的数字符号的个数称为数制的基,数制中每一个数值所具有的值(Rk)称为数制的位权。对于R进制数,有数字符号0,1,2,…,R-1,共R个,基数是R,k是指数。进位规则是逢R进1。表1-2所示为常见数制。
表1-2 常见数制
续表
(2)数制转换。
无论使用哪一种数制,数值的表示都包含两个基本要素:基数和位权。
基数是一个数制允许选用的数字符号的个数,一般而言,R进制数的基数为R,可供选用的数字符号有R个,分别为0~R-1,每个数位计满R就向其高位进1,即“逢R进一”。
位权简称“权”,是指一个数制中,各位数字符号所表示的数值等于该数字符号值乘以一个与该数字符号所处位置有关的常数。位权的大小是以基数为底,数字符号所处位置的序号为指数的整数次幂。各数字符号所处位置的序号计法为:以小数点为基准,整数部分自右向左依次为0,1…递增,小数部分自左向右依次为-1,-2…递减。
按权展开后,相加即可。
例1-1 (1101.011)2=1×23+1×22+0×21+1×20+0×2-1+1×2-2+1×2-3=(13.375)10
②十进制转换为二进制。
整数部分:采用除2取余法,且除到商为0为止;按从下往上顺序排列余数即可得到结果。先取余数低位,后取余数高位。
小数部分:采用乘2取整法,直到小数部分为0或达到所要求精度为止(小数部分可能永远不会为0),最先得到的整数排在最高位。
例1-2 (303)10=( )2
解答如图1-11所示。
例1-3 (0.687 5)10=( )2
解答如图1-12所示。
③二、八、十六进制之间的相互转换。
由于二、八、十六进制之间存在这样一种关系——23=8,24=16,所以,每位八进制数相当于3位二进制数,每位十六进制数相当于4位二进制数,在转换时,位组划分是以小数点为中心向左、右两边延伸,中间的0不能省略,两头位数不足时可补0,如表1-3所示。
图1-11 例1-2解答
图1-12 例1-3解答
表1-3 十进制、二进制、八进制、十六进制对应表
2)字符编码
(1)ASCII码
字符是计算机中使用最多的信息形式之一,在计算机中,要为每个字符指定一个确定的二进制编码,作为识别与使用这些字符的依据。字符编码就是规定用二进制数表示文字和符号的方法。在西文领域,目前普遍采用的字符编码是ASCII码(美国标准信息交换码),其有7位版本和8位版本两种。
目前,国际上通用的且使用最广泛的字符有:十进制数字符号0~9,大、小写的英文字母,各种运算符、标点符号等,这些字符的个数不超过128个。由于需要编码的字符不超过128个,因此,用7位二进制数就可以对这些字符进行编码。7位ASCII码也称为标准ASCII码,如表1-4所示。
ASCII码是唯一的,没有两个字符的ASCII码值是一样的。7位ASCII码的常用码值如下:
32~126号(共95个)是字符(32号是空格),其中48~57号为0~9十个阿拉伯数字,65~90号为26个大写英文字母,97~122号为26个小写英文字母。
表1-4 7位ASCII码
8位ASCII码是指一个字符用8位二进制数来表示,可表示256个字符(0~255)。
(2)汉字编码。
每个国家使用计算机都要处理本国语言。1980年我国颁布了《信息交换用汉字编码字符集-基本集》,即国家标准GB 2312—1980。其共收集汉字6 763个,分为两级。第一级3 755个汉字,属常用汉字,按汉字拼音字母顺序排列。第二级3 008个汉字,属次常用汉字,按部首排列。
1995年我国又颁布了《汉字编码扩展规范》(GBK)。GBK与GB 2312—1980国家标准所对应的内码标准兼容,同时在字汇一级支持ISO/IEC 10646—1和GB 13000—1的全部中、日、韩(CJK)汉字,共计20 902字。
①汉字外部码。
汉字外部码又称汉字输入码,是指从键盘上输入汉字时采用的编码。目前广泛使用的汉字输入码有很多种。
a.以汉字读音为基础的拼音码,如全拼输入法、双拼输入法、词汇输入法、智能ABC输入法等;
b.以汉字字形为基础的字形码,如五笔字型输入法;
c.音形码,综合拼音码和字型码的特点,如自然码等;
d.数字码,如区位码、电报码、内码等。
不同的汉字输入方法有不同的外码,但内码只能有一个。好的输入方法应具有规则简单、操作方便、容易记忆、重码率低、速度快等特点。
②汉字国标码。
GB 2312—1980编码简称国标码。由于汉字数量大,无法用一个字节进行编码,因此使用两个字节对汉字进行编码。规定两个字节的最高位用来区分ASCII码。这样国标码用两个字节的低7位对汉字进行编码。
③汉字字形码。
汉字字形码又称汉字字模,用于汉字的输出。汉字的字形通常采用点阵的方式产生。汉字点阵有16×16点阵、32×32点阵、64×64点阵,点阵不同,汉字字形码的长度也不同。点阵数越大,字形质量越高,汉字字形码占用的字节数越多。
3)计算机中数据的存储单位
(1)位(bit):用字符“b”表示,是计算机中存储数据的最小单位。一个二进制数(0或1)为1位。
(2)字节(byte):1个字节等于8个二进制位,通常用字符“B”表示。字节是数据处理和存储的基本单位,如一个英文字母占一个字节,一个汉字占两个字节。
此外,计算机中还经常使用字符KB、MB、GB或TB表示存储设备的容量或文件的大小,它们之间的换算关系如下:
1 B=8 b
1 KB=1 024 B
1 MB=1 024 KB=1 024×1 024 B
1 GB=1 024 MB=1 024×1 024×1 024 B
1 TB=1 024 GB=1 024×1 024×1 024×1 024 B
有关大学生计算机应用基础(第3版)的文章
■任务情景小明在使用word进行文档处理时,想到计算机中只有0和1,很疑惑文字、图片等非数值信息在计算机中是怎么存储和处理的呢?■任务分析◆英文字符的编码◆汉字信息的表示◆其他信息的表示■知识准备1.英文字符编码在计算机中,对非数值的文字和其他符号进行处理时,要对文字和符号进行数字化处理,即用二进制编码来表示文字和符号。目前广泛使用的汉字机内码是变形的国标码。汉字的矢量表示法将汉字视为由笔画组成的图形。......
2023-11-18
在计算机内部,各种信息都必须转化成0和1的二进制编码的形式后才能被传送、存储和处理。在计算机内部所有的数据,无论是程序还是图像都是以二进制形式存放的。下面介绍计算机中数据的组织形式。字长是衡量计算机性能的一个重要标志。某个存储设备所能容纳的二进制信息量的总和称为存储设备的存储容量。目前,微型计算机的存储容量已从刚开始几兆字节发展到现在的几百太字节至几千太字节。......
2023-11-20
表2-4给出了ASCII码128个字符的编码。因此,ASCⅡ码表示的128个字符编码的最高位为0。我们把一位0、1符号称作一个二进制码,则字符的十六进制编码是把4位二进制码用一个符号表示。要说明的是,字符编码的十六进制形式只是字符编码二进制形式的另外一种表示方式,它是表示形式上的一种转换,字符在计算机内只能以二进制码形式存储和传送。......
2023-11-18
处理信息时,将信息转换成对应的二进制编码来表示。字节,是计算机表示数据的基本单位,简记为“B”,规定一个字节为8位,即1 Byte=8 bit。微机中常用的字符编码是ASCII码,即美国标准信息交换码的英文简称,是计算机中用二进制表示字母、数字、符号的一种编码标准。......
2023-11-16
实型常量又称为实数,在C语言中又称为浮点数。例如,e3,1.1e2.1,e这些都是不合法的指数形式。表2.2实型数据实型数据在内存中的存储方式与整型数据不同。系统把一个实型数据分成小数部分和指数部分分别存放。实型变量的定义。①实型变量的定义有两种形式,分别表示单精度类型和双精度类型。例2.2实型数据的舍入误差。原因是一个实型变量的有效数字是7位,超过7位后的数字无意义。......
2023-11-18
信号又是运载消息的工具,是消息的载体。信息资源广泛存在于经济、社会各个领域和部门。图1-15 数据在计算机中的存在形式1.4.2 数据在计算机中的表示各种各样的数据存放在计算机中,都是以二进制数的形式保存的,在完成处理后输出时,则按照其原有的形式输出。......
2023-11-26
当把算法用于人类和计算机之间传递智能时,文字形式算法的主要缺点是表示方法不规范,不同的人描述的相同的算法在用词和语句上有很大差异。又例如,计算机在执行每条语句前,需要首先“识别”出每条语句,C语言程序中每条语句结束后增加的语句结束标记符号“;”,表示当前的一条语句到此结束,这样的标识就方便了计算机对程序语句的“识别”。......
2023-11-18
汉字在计算机内的表示虽然汉字使用不同的输入码或其他方法输入计算机,但同一个汉字在计算机内部的编码仍然是一样的。在计算机内部,汉字的区号和位号分别用1个字节表示,为了与ASCII码有所区别,把字节的最高位均规定为1。BIG5使用了与GB 2312大致相同的编码范围来表示繁体汉字。其简化方案是使用两个字节表示编码,称为“UCS-2”。......
2023-10-22
相关推荐