参考答案: A
详细解析:
计算机中表示的数据分为两大类,即数值数据和非数值数据(符号数据)。
数值数据用来表示数量的多少,它包括定点小数、整数、浮点数和十进制数串4种类型。它们通常都带有表示数值正负的符号位。
非数值数据(符号数据)则用于表示一些符号标记,如英文字母、数字、标点符号、运算符号、汉字、图形、语言信息等。由于在计算机中,这些数据都是用二进制编码的,所以,这里提到的数据的表示,实质上是它们在计算机中的组成格式和编码方法。
1.数值数据的编码
数值数据在计算机内用二进制编码表示,常用的编码有原码、反码和补码。这里仅介绍带符号整数的原码、反码和补码,并设机器字长为8位。
①原码表示法
原码表示法是机器数的一种简单的表示法。其正数的符号位为0,负数的符号位为1,其他位按一般的方法表示数的绝对值,用这样的表示方法得到的就是数的原码。
②反码表示法
机器数的反码可由原码得到。正数的反码与其原码相同,负数的反码为其原码除符号位外的各位按位取反(即是0的改为1,是1的改为0)。
③补码表示法
机器数的补码可由原码得到。正数的补码与其原码相同,负数的补码为其反码在最低位加1。
2.非数值数据(符号数据)的编码
计算机中,对非数值的文字和其他符号进行处理时,要对文字和符号进行数字化处理,即用二进制编码来表示文字和符号。字符编码就是规定用怎样的二进制编码来表示文字和符号。
(1)BCD码(二-十进制编码)
人们习惯于使用十进制数,而计算机内部多采用二进制数表示和处理数值数据,因此在计算机输入和输出数据时,就要进行由十进制到二进制和从二进制到十进制的转换处理,这是多数应用环境的实际情况。BCD编码方法有很多,通常采用的是8421编码。这种编码较为自然、简单。其方法是用四位二进制数表示一位十进制数,自左至右每一位对应的位权分别是8、4、2、1。值得注意的是,四位二进制数有0000~1111十六种状态,这里我们只取了0000~1001十种状态。而1010~1111六种状态在这种编码中没有意义。
这种编码的另一特点是书写方便、直观、易于识别。
(2)ASCII 编码
计算机中的字符按一定的规则用二进制编码表示,一般用8个二进制位进行编码的,目前最普遍采用的编码是ASCII (American Standard Code for Information Interchange)即美国标准信息交换码。
ASCII码编码规则为:8个二进制位的最高位为零,余下的7位可进行编码。7个二进制位表示,共有128个字符,其中有33个控制字符,95个英文字母、数字、标点符号等可显示的字符。
(3)汉字编码
为了适应中文信息处理的需要,1981年我国公布了《信息交换用汉字编码字符集——基本集》,简称GB2312-80,该基本集中共有7 445个汉字及符号,其中汉字6 763个。根据汉字的使用频度,将6 763个汉字分为两级,一级汉字3 755个,按拼音顺序排列,二级汉字 3008个,按部首排列。
用计算机来处理汉字信息,首先要将汉字代码化,然后输入计算机,并将其转换成汉字内码,才能进行信息处理,处理完毕,再将汉字内码转化成汉字字形码,才能在显示器显示或打印机上打印。
①汉字输入码:用键盘上的数字、字母或其他符号对汉字进行编码,编码方案有多种。
数字编码:是用二进制的数字串来表示汉字的输入码,常用的是区位码。它是将GB2312-80基本集中的6 763个汉字分成94个区,每个区有94位。区位码输入是用4位十进制数输入汉字所在的区号和位号。该输入法的优点是无重码,且输入码与内码转化方便,缺点是难记忆。