计算机是如何处理汉字的?

作者&投稿:鬱刷 (若有异议请与网页底部的电邮联系)
1.汉字信息的编码知识
⑴国标码:是指我国1981年公布的“中华人民共和国国家标准信息交换汉字编码”,代号为“GB2312-80”。由连续的两个字节组成。

2.机内码:在计算机内表示汉字的代码是汉字机内码,汉字机内码由国标码演化而来,把表示国标码的两个字节的最高位分别加“1”,就变成汉字机内码

3.输入码: 汉字输入码是指直接从键盘输入的各种汉字输入方法的编码,属于外码。

4.字型点阵码:用点阵方式来构造汉字字型,然后存储在计算机内,构成汉字字模库。目的是为了能显示和打印汉字。

编码的转换举例

汉字 区位码 16进制 国标码 机内码

文 4636 2E24H 4E44H CEC4H

“文”的区位码为4636,区码和位码分别用16进制表示即为“2E24H”, 0010 1110 0010 0100

转换成国标码“4E44H”,0100 1110 0100 0100

机内码为“CEC4H”, 1100 1110 1100 0100

回答时间:2006-09-12 11:50:48

计算机只识别由0、1组成的代码,ASCII码是英文信息处理的标准编码,汉字信息处理也必须有一个统一的标准编码。我国国家标准局于1981年5月颁布了《信息交换用汉字编码字符集——基本集》,代号为GB2312-80,共对6763个汉字和682个图形字符进行了编码,其编码原则为:汉字用两个字节表示,每个字节用七位码(高位为0),;国家标准将汉字和图形符号排列在一个94行94列的二维代码表中,;每两个字节分别用两位十进制编码,前字节的编码称为区码,后字节的编码称为位码,此即区位码,;如“保”字在二维代码表中处于17区第3位,区位码即为“1703 ”。

国标码并不等于区位码,它是由区位码稍作转换得到,其转换方法为:先将十进制区码和位码转换为十六进制的区码和位码,;这样就得了一个与国标码有一个相对位置差的代码,;再将这个代码的第一个字节和第二个字节分别加上20H,就得到国标码。如:“保”�字的国标码为3123H,它是经过下面的转换得到的:1703D->1103H->+20H->3123H。

国标码是汉字信息交换的标准编码,但因其前后字节的最高位为0,与ASCII码发生冲突,如“保”�字,国标码为31H和23H,而西文字符“1”和“#”的SCII也为31H和23H,现假如内存中有两个字节为31H和23H,;这到底是一个汉字�,还是两个西文字符“1”;和“#”?于是就出现了二义性,显然,国标码是不可能在计算机内部直接采用的,于是,;汉字的机内码采用变形国标码,其变换方法为:将国标码的每个字节都加上128,即将两个字节的最高位由0改1,其余7位不变,如:由上面我们知道,“保”字的国标码为3123H,前字节为00110001B,后字节为00100011B,高位改1为10110001B和10100011B 即为B1A3H,因此,�字的机内码就是B1A3H;。

~

在计算机中对汉字进行存储、处理和传输的汉字码是什么码
答:在计算机中对汉字进行存储、处理和传输的汉字码是机内码。机内码是在计算机内部存储,处理加工和传输汉字时所用的由0和1符号组成的代码。输入码被接受后就由汉字操作系统的“输入码转换模块”转换为机内码,与所采用的键盘输入法无关。机内码是汉字最基本的编码,不管是什么汉字系统和汉字输入方法,输入...

计算机是如何识别文字的?
答:内码:汉字内码是在设备和信息处理系统内部存储、处理、传输汉字用的代码。无论使用何种输入码,进入计算机后就立即被转换为机内码。规则是将国标码的高位字节、低位字节各自加上128(十进制)或80(十六进制)。例如,“中”字的内码以十六进制表示时应为F4E8。这样做的目的是使汉字内码区别于西文的ASCI...

计算机内部处理汉字所采用的编码形式是ascii还是机内码啊?
答:电脑内部处理汉字所采用的编码形式是机内码。大部分电脑要用于信息管理,因此,需要把有关的信息进行二进制编码。国际上通用的是ASCII码,即美国标准信息交换码,它用七位二进制编码来表示十进制数、英文字母和常用符号,如运算符、括号、标点符号、标识符等,还有一些控制符,一共可以表示128个字符。其中...

全国计算机应用基础知识:汉字、字符编码
答:④ 字长:每个字所包含的位数称为字长。由于字长是计算机一次可处理的二进制数的位数,因此它与计算机处理数据的速率有关,是衡量计算机性能的一个重要因素。 (2)字符的编码。 ① ASCII码。 计算机只能识别二进制数,因此计算机中的数字、字母、符号也必须用二进制进行编码。编码方法有多种,微型机中普遍采用的是ASC...

汉字在计算机内部采用的编码是
答:汉字机内码,又称“汉字ASCII码”,简称“内码”,指计算机内部存储,处理加工和传输汉字时所用的由0和1符号组成的代码。输入码被接受后就由汉字操作系统的“输入码转换模块”转换为机内码,与所采用的键盘输入法无关。机内码是汉字最基本的编码,不管是什么汉字系统和汉字输入方法,输入的汉字外码到机...

简述计算机的工作原理
答:计算机的工作原理:计算机在运行时,先从内存中取出第一条指令,通过控制器的译码,按指令的要求,从存储器中取出数据进行指定的运算和逻辑操作等加工,然后再按地址把结果送到内存中去。接下来,再取出第二条指令,在控制器的指挥下完成规定操作。依此进行下去。直至遇到停止指令。程序与数据一样存贮,...

汉字信息处理过程中需要使用哪些汉字编码?各自的作用是什么?
答:(1)汉字输入码,简称外码,其作用是将汉字信息输入到计算机内部;(2)汉字交换码,其作用是在汉字信息系统之间进行汉字交换时所使用的编码;(3)汉字内码,其作用是信息处理系统内部存储、处理、传输汉字而使用的编码;(4)汉字字形码,其作用是表示汉字字形信息的编码,在显示或打印的时候使用;参考...

在计算机中,汉字采用什么码存放。
答:机内码。计算机只识别由0、1组成的代码,ASCII码是英文信息处理的标准编码,汉字信息处理也必须有一个统一的标准编码。 汉字交换码(国标码)主要用于汉字信息交换,《信息交换用汉字编码字符集——基本集》,代号为GB2312-80,共对6763个汉字和682个图形字符进行了编码。国标码是汉字信息交换的标准编码,...

计算机中信息的传递是以什么为单位?
答:综上所述,计算机中通常是以(字)为单位传送信息的。不是字节!不是位!补充:字长 数在机算机中的表示形式称为机器数,用二进制表示。表示机器数的二进制的位数称为计算机的字长,字长是计算机存储、传送和处理数据的信息单位。不同的计算机其字长不同,有8位、16位、32位、64位等。字长位数大...

在计算机系统内部使用的汉字编码是___?
答:汉字机内码,又称“汉字ASCII码”,简称“内码”,指计算机内部存储,处理加工和传输汉字时所用的由0和1符号组成的代码。输入码被接受后就由汉字操作系统的“输入码转换模块”转换为机内码,与所采用的键盘输入法无关。机内码是汉字最基本的编码,不管是什么汉字系统和汉字输入方法,输入的汉字外码到机...