中大网校

7.8 信息表示

一、《教试大纲》的规定

信息在计算机内的表示；二进制编码；数据译位；计算机内数值数据的表示；计算机内非数值数据的表示；信息及其主要特征。

二、重点内容

1 ．信息及其主要特征

信息是由数据产生的，是数据经加工后的结果，是反映客观事物规律的一些数据。数据是客观地记录事物的性质、形态、数量特征的抽象符号，如文字、数字、图形、曲线等。

可见，数据是信息的符号，信息的载体；信息是数据的内涵，是对数据语义的解释。通过数据这种形式来表示信息，便于理解和接受。在计算机内部，信息也是采用数据形式进行表示的。

信息的主要特征是：可识别性、可变性、可流动性、可存储性、可处理性、可再生性、有效性与无效性、属性，以及使用性等。

2 ．信息在计算机内的表示

比特（bit）是计算机用来表示二进制中一位信息的，是计算机内表示数据的最小单位，它仅有两个可能的值： “0”或“1”，表示事件的两个不同状态。所有信息（如数字、文字、图像、视频、音频等信息）在计算机内都是用不同位数的 bit 表示，即均是用二进制数据的形式表示并存储。由此，计算机才能够对上述各种信息进行计算、处理、存储和传输。

3 ．数据单位

计算机的信息单位常采用位、字节、字、机器字长等。

（ 1 ）位（ bit ），是度量数据的最小单位，表示一位二进制信息，其缩写为小写 b。

（ 2 ）字节（ byte ），一个字节是由 8 位二进制数字组成（1byte=8bit ）；字节是信息存储中常用的基本单位，如计算机的存储器（包括内存储器和外存储器）通常以多少字节来表示其容量。

（ 3 ）字（ word ），又称为计算机字，是位的组合，并作为一个独立的信息单位处理。字取决于计算机的类型、字长以及使用者的要求，常用的固定字长有 8 位、 16 位、 32 位等。在微机系统内有一个约定，即：一个字大小规定成是两个字节（ 1 word=2byte ）。

（ 4 ）双字（ double word ），是由两个 16 位的二进制数据组成，即由 32 位二进制数据组成。 1 双字=2 个字=4 个字节=32 个 bit 。

（ 5 ）机器字长，是指参加运算的寄存器所拥有的二进制数的位数。它代表了机器的精度，机器的功能设计决定了机器的字长。可见，机器字长是一个与机器硬件指标有关的单位。

由于信息存储容量的增加，计算机存储容量的单位也在变多、变大：

（ 1 ）千字节（ kb ），其中 k 表示千， b 表示字节， ik= 1024 。用二进制表示， 2¹⁰=1024 ，要用 10 位二进制数表示。

（ 2 ）兆字节（ mb ） , 1m=1024k = 1024 *1024 ，用二进制表示， 2²⁰ =1m ，要用 20 位二进制数表示。目前 32 位微型计算机的内存储器通常为 128mb ，或 256mb ，或 512mb ，或 1 . 0gb 等。

（ 3 ）吉字节（ gb ） , 1g=1024m ，用二进制表示， 2³⁰=l024m ，要用 30 位二进制数来表示。目前硬盘存储器常用 gb 量度。

（ 4 ）太拉字节（ tb ） , 1t= l024g ，用二进制表示， 2 ⁴⁰=1024g ，要用 40 位二进制数来表示。

4 ．计算机内数值数据的表示及二进制编码

计算机中的数值数据分成整数和实数两大类。

（ 1 ）整数的表示计算机中的整数分为无符号整数和有符号整数。由于整数的小数点隐含在个位数的右面，也称为定点数。

1 ）无符号整数，这类整数一定是正整数，故无符号整数的所有二进位都用来表示数值，它们可以是 8 位、 16 位、 32 位或 64 位。 8 位二进制无符号整数，其十进制取值范围为 0~255 （ 2⁸~1 ），同理， 16 位二进制无符号整数，其十进制取值范围为。0~65535 （ 2¹⁶ 一 1 ）。在计算机中，无符号整数除了表示数据以外，也常用于表示地址。

2 ）有符号整数，有符号整数必须使用一个二进位表示符号，称为符号位。通常符号位放在二进制数的最左面的一位，即最高位，一般规定0表示” +”（正数） , 1 表示“-”（负数）。在计算机中有符号数的表示是将符号位和数值位一起编码。为此引人两个基本概念：机器数和真值，机器数是指数在计算机中的二进制表示形式，真值（或称计算数的真值）是指带符号位的机器数所对应的数值。

有符号整数在计算机内有三种编码方法：原码、补码和反码。

① 原码表示法，此时计算数的最高一位表示符号，0表示正数,1 表示负数，其余各位则表示数值的大小（绝对值）。如：

x = + 0101010 [ x]原＝ 00101010 （不变）

x ＝－0101010 [ x] 原＝ 10101010 （负号“一”用 1 表示）

② 反码表示法，对于正数，反码表示和原码表示相同；对于负数，其反码是除符号位外，原码的每位求反（即。0变为 1 , 1 变为 0 ），如：

x=＋ 0101010 [x］原＝ 00101010 .[x ］反＝ 00101010

x ＝-0101010 [x]原＝ 10101010 [x]反＝ 11010101

③ 补码表示法，对于正数，补码表示和原码表示相同；对于负数，其补码是将原码除符号位外，原始的每位求反（即0变 1 , 1 变 0 ），末位加 1 ，如：

x = + 0101010 [x]原=00101010 [x]补＝ 00101010

x＝- 0101010 [x]原＝ 10101010 [x]补＝ 11010110

在计算机中的整数常采用补码表示。

3 ）二进制编码的十进制数即 bcd 整数。在计算机内常使用 bcd整数，它使用 4 位二进制表示一位十进制数，符号的表示与上面相同，如：

（ + 67 ） ₁₀=（ 0 0110 0111 ）_bcd

需注意，采用 bcd整数，计算机内整数采用原码表示；采用 16 位整数、 32 位短整数、 64 位长整数，计算机内整数采用补码表示。

（ 2 ）实数的表示

任何一个实数都可以用一个指数（整数）和一个纯小数来表示。如：

十进制数： 15 . 815=10²×（ 0 . 15815 ）

二进制数： 111 . 011 = 2⁰¹¹×（0 .111011 ）

由于实数的小数点的位置是不固定的，所以也称为浮点数。整数称为浮点数的阶码，纯小数称为浮点数的尾数。这种用阶码和尾数来表示实数的方法，称为浮点表示式。浮点数的长度可以是 32 位、 64 位等，位数越多，可表示的数值的范围就越大，精度也越高。为了统一、标准化计算机的浮点数表示方法， 1985 年美国 ieee （电气及电子工程师协会）提出了 ieee754 标准，目前计算机系统内几乎都采用了该标准。

5 ．计算机内非数值数据的表示

在计算机内部，非数值信息也是采用0和 1 两个符号来进行编码表示的。非数值数据又可划分为文字、多媒体两大类。

（ 1 ）文字

① 西文

文符的编码， ascii码是“美国信息交换标准代码”的简称，在这种编码中，每个字符用 7 个二进制位表示，即从 0 000000 到 1111111 可以给出 128 种编码，可用来表示 128 个不同的字符。一个字符的 ascii码通常占用一个字节，由七位二进制数编码组成，故 ascii 码最多可表示 128 个不同的符号。由于 ascii码采用七位编码，来用到字节的最高位，故在计算机中一般保持为“0” ，在数据传输时可用作奇偶校验位。

② 汉字的编码

目前，我国使用的是“国家标准信息交换用汉字编码” （ g13 2312 一 1980 标准），该标准码是二字节码，用二个七位二进制数编码表示一个汉字，并收人了 6763 个汉字。

汉字在计算机内的表示，有多种编码，如汉字输入码，输人码进人计算机后，必须转换成汉字内码，才能进行信息处理。为了最终显示、打印汉字，再由内码转换成汉字字形码。此外，为使不同的汉字处理系统之间能够交换信息，还必须设有汉字交换码。

（ 2 ）多媒体数据

① 图像数据

位图是指存储在计算机中的由图像中许多点构成的点阵图。构成位图的这些点称为像素，用以描述图像中各图像点的亮度与颜色。

图像分辨率是指图像点阵中行数和列数的乘积。

屏幕分辨率是指计算机显示器屏幕上的最大显示区域以水平和垂直方向的像素个数的乘积。

像素分辨率是指一个像素的长和宽的比例。

图像的颜色深度是指图像中可能出现的不同颜色的最大数目。颜色深度值越大，图像的色彩越丰富。位图中每个像素都用一位或多位二进制位来描述其颜色的信息。

图像文件的大小是指存储整幅图像所需的磁盘字节数，计算式为：

图像文件大小＝图像分辨率×颜色深度÷8

② 视频数据

视频信号经数字化处理之后，以视频文件格式存储在计算机内。视频信号也可视为图像数据中的一种，由若干有联系的图像数据连续播放而形成。计算机所播放的视频信号是数字信号，与电视上翻放的模拟视频信号是不一样的。由于视频信号的数据量很大，所以在存储和传输数字视频过程中要采用压缩编码技术。

③ 音频数据

音频数据在计算中可分为数字音频文件和 midi 文件。数字音频文件是将声音信号数字化处理后的数据文件。 midi 文件是通过一串时序命令，用于记录电子乐器键盘弹奏的信息，包括键名、力度和时值长短等，是对乐谱的一种数字式描述。

5．目前我国汉字编码标准，一个汉字的编码占用（b）字节。

a ．一个

b ．两个

c ．三个

d ．四个

7．一幅 640×480 像素的 256 色图像文件大小为（b） kb。

因为256色的颜色深度是8（2⁸）个二进制数。图像文件大小为640×480/1000=307 . 2

a . 153 . 61；

b . 307 . 2 ；

c . 370 . 22 ；

d . 614 . 44