11汉字的内码和外码有什么区别? 什么是汉字的内码、外码、交换码、字形码?

作者&投稿:涂戚 (若有异议请与网页底部的电邮联系)
输入码:

又称汉字外码,无论是区位码或国标码都不利于输入汉字,为方便汉字的输入而制定的汉字编码,称为汉字输入码。汉字输入码属于外码。不同的输入方法,形成了不同的汉字外码。常见的输入法有以下几类:

按汉字的排列顺序形成的编码(流水码):如区位码;

按汉字的读音形成的编码(音码):如全拼、简拼、双拼等;

按汉字的字形形成的编码(形码):如五笔字型、郑码等;

按汉字的音、形结合形成的编码(音形码):如自然码、智能ABC

国标码:

计算机只识别由0、1组成的代码,ASCII码是英文信息处理的标准编码,汉字信息处理也必须有一个统一的标准编码,所以国标码应运而生。所谓“国标码”,是指国家标准汉字编码。一般是指国家标准局1981年发布的《信息交换用汉字编码字符集(基本集)》,简称GB-2312。在这个集中,收进汉字6763个,其中一级汉字3755个,二级汉字3008个。一级汉字为常用字,按拼音顺序排列,二级汉字为次常用字,按部首排列。

区位码:

简单地理解的话,区位码就是国标码,但也是有些区别的,

在GB-2312中预留了一些空位,可以进行补充、扩展,经扩展的区位码就从数量、范围上超过了GB-2312(6763)了。上面是就大陆而言的,台湾、香港、和其他汉语国家,也是用区位码,但他们的区位号与大陆用的就不一定相同了。

机内码(汉字内码):

计算机还不能将国标码作为汉字在计算机中的机内码,因为会和ASCII码发生冲突,如“保”,国标码为31H和23H,而西文字符“1”和“#”的SCII也为31H和23H,现假如内存中有两个字节为31H和23H,;这到底是一个汉字?,还是两个西文字符“1”;和“#”呢,于是就有了冲突。所以国家标准规定将汉字国标码每个字节的最高位统一规定为“1”作为识别汉字代码的标志,首位是“0”即为字符,首位是“1”即为汉字,这样就形成了机内码。汉字在计算机中是用机内码来表示的。

区位码,国标码,机内码的转换

(1)区位码先转换成十六进制数表示

(2)(区位码的十六进制表示)+2020H=国标码;

(3)国标码+8080H=机内码

字型码

汉字输出码提供输出汉字时所需要的汉字字型,用以将机内码还原为汉字进行输出。由于汉字是由笔画组成的方字,所以对汉字来讲,不论其笔画多少,都可以放在相同大小的方框里,如用M行N列的小圆点组成的方块(称为汉字的字模点阵),那么每个汉字都可以用点阵中的一些点组成。每个点用一位二进制表示,有笔形的为1,否则为0,就可得到该汉字的字形码。全部汉字字码的集合叫汉字字库。

总的来说,为方便汉字输入而形成的汉字编码为输入码,属于汉字的外码,输入码因编码方式不同而不同。为在计算机内表示汉字而统一的编码方式形成汉字编码叫国标码,计算机还不能将国标码作为汉字在计算机中的表现形式,因为会和ASCII码发生冲突,所以又产生了汉字的机内码,机内码是惟一的。为显示和打印输出汉字而形成的汉字编码为字型码,计算机通过汉字内码在字模库中找出汉字的字型码,实现其转换。

内码是汉字在计算机内部存储,处理和传输用的信息编码。它必须与ASCII码兼容但又不能冲突。

所以把国标码两个字节的最高位置'1',以区别于西文,这就是内码。汉字的输入码称为"外码"。输入码即指我们输入汉字时使用的编码。常见的外码分为数字编码(如区位码),拼音编码和字形编码(如五笔)。

在计算机中,汉字编码的内码和外码分别指的是什么?~

字形码:汉字字形码是表示汉字字形的字模数据,通常用点阵、矢量函数等方式表示,用点阵表示字形时,汉字字形码一般指确定汉字字形的点阵代码。字形码也称字模码,它是汉字的输出形式,随着汉字字形点阵和格式的不同,汉字字形码也不同。常用的字形点阵有16×16点阵、24×24点阵、48×48点阵等等。字模点阵的信息量是很大的,占用存储空间也很大,以16×16点阵为例,每个汉字占用32(2×16=32)个字节,两级汉字大约占用256KB。因此,字模点阵只能用来构成“字库”,而不能用于机内存储。字库中存储了每个汉字的点阵代码,当显示输出时才检索字库,输出字模点阵得到字形。
机内码:计算机中字符的实际存储码。如西文字符,在计算机中是以ascii码的形式进行存储的,而我们的汉字,是在区位码的基础上加上A0H(16进制),就变成了汉字在计算集中的存储码,也就是机内码。

1、内码是指计算机汉字系统中使用的二进制字符编码,是沟通输入、输出与系统平台之间的交换码,通过内码可以达到通用和高效率传输文本的目的。如ASCII。
2、外码是相对于内码而言的辞汇。在计算机科学及相关领域中,外码指的是“外在的‘经过学习之后,可直接了解的编码形式(例如:文字或语音符号)’”。
中文输入法对汉字的编码即属外码。常见的中文外码有仓颉码、行列码、大易码、呒虾米码、注音码、拼音码。
3、交换码是指用于交换文件所使用的编码。对于计算机而言,不同的系统有可能使用不同的内码。但如果不同系统间要交换文件,则会发生乱码现象。解决方法则为,在交换文件前,文件提供者先将由内码形式储存的文件转换成交换码形式再做交换。在接收文件后,文件接收者再由交换码转成内码。
4、字形码,点阵代码的一种。为了将汉字在显示器或打印机上输出,把汉字按图形符号设计成点阵图,就得到了相应的点阵代码(字形码)。用于显示的字库叫显示字库。显示一个汉字一般采用16×16点阵或24×24点阵或48×48点阵。已知汉字点阵的大小,可以计算出存储一个汉字所需占用的字节空间。

5、汉字机内码,又称“汉字ASCII码”,简称“内码”,指计算机内部存储,处理加工和传输汉字时所用的由0和1符号组成的代码。输入码被接受后就由汉字操作系统的“输入码转换模块”转换为机内码,与所采用的键盘输入法无关。机内码是汉字最基本的编码,不管是什么汉字系统和汉字输入方法,输入的汉字外码到机器内部都要转换成机内码,才能被存储和进行各种处理。

参考资料来源:百度百科-汉字机内码
参考资料来源:百度百科-内码
参考资料来源:百度百科-外码
参考资料来源:百度百科-交换码
参考资料来源:百度百科-字形码

...简体汉字编码中区位码、国标码、机内码、外码、字形码的区别及关系...
答:总结:内码:编码的核心,确保汉字的统一性;外码/输入码:输入友好,满足日常使用需求;字形码/输出码:用于屏幕上清晰呈现,是视觉呈现的关键;ASCII码则无需输入码,与现代汉字编码体系形成对比。通过GB系列编码,我们了解了区位码、国标码和机内码之间的转换逻辑。继续我们的编码探索之旅,下一章我们将...

一个字符的ascii码与它的内码相同吗?
答:由于ASCII码只用7位,所以,这个首位上的“1”就可以作为识别汉字代码的标志,计算机在处理到首位是“1”的代码时把它理解为是汉字的信息,在处理到首位是“0”的代码时把它理解为是ASCII码。2、外码:也叫输入码,是用来将汉字输入到计算机中的一组键盘符号。英文字母只有26个,可以把所有的字符都...

汉字外码是指什么?常用的汉字外码有哪些?
答:汉字输入码(外码)是指用户从键盘上键入汉字时所使用的汉字编码。内码是汉字在计算机内部存储,处理和传输用的信息编码。它必须与ASCII码兼容但又不能冲突。 常用的输入码:数字编码-区位码;拼音编码-全拼、双拼、微软拼音输入法、自然码、智能ABC、搜狗等等;字形编码-五笔、表形码、郑码输入法...

汉字的四种主要编码为
答:汉字的四种主要编码为:汉字输入码、汉字国标码、汉字内码和汉字字形码。汉字输入码,又称为外码,是用户用于输入汉字的一组键盘符号。例如,拼音输入法和五笔输入法是常见的汉字输入码。拼音输入法根据汉字的拼音来输入,如“ni”对应“你”,而五笔输入法则根据汉字的笔画和结构来...

一个汉字的机内码与国标码之间的差别是什么?
答:机内码是汉字最基本的编码,不管是什么汉字系统和汉字输入方法,输入的汉字外码到机器内部都要转换成机内码,才能被存储和进行各种处理。相关内容解释:汉字机内码、国标码和区位码三者之间的关系为:区位码(十进制)的两个字节分别转换为十六进制后加2020H得到对应的国标码。机内码是汉字交换码(国标码)...

一个汉字的机内码与国标码之间的差别是什么?
答:机内码是汉字交换码(国标码)两个字节的最高位分别加1,即汉字交换码(国标码)的两个字节分别加80H得到对应的机内码。大部分汉字系统都采用将国标码每个字节最高位置1作为汉字机内码。机内码变形国标码原因:国标码是汉字信息交换的标准编码,但因其前后字节的最高位为0,与ASCII码发生冲突,如"保...

一个汉字的机内码与国标码之间的差别是什么啊?
答:一个汉字的机内码与国标码之间的差别是前者各字节的最高位二进制值各为1,而后者为0。所以选项为A。一个汉串的机内码用2个字节存储,并把每个字节的最高二进制位置1,而国标码则是把两个字节的最高位二进制位置0。因为汉字处理系统要保证中西文的兼容,当系统中同时存在ASCII码和汉字国标码时,...

什么是外码?
答:外码指的是“外在的‘经过学习之后,可直接了解的编码形式(例如:文字或语音符号)’”。中文输入法对汉字的编码即属外码。常见的中文外码有仓颉码、行列码、大易码、呒虾米码、注音码、拼音码。

汉字的常用编码输入码、机内码、输出码各是什么意思?
答:1.机内码:在计算机内表示汉字的代码是汉字机内码,汉字机内码由国标码演化而来,把表示国标码的两个字节的最高位分别加“1”,就变成汉字机内码。2.输入码: 汉字输入码是指直接从键盘输入的各种汉字输入方法的编码,属于外码。一. 基本概念 Hanzi bianma汉字编码(Chinese character encoding )是为...

一个汉字的机内码与国标码的差别是?
答:处理加工和传输汉字时所用的由0和1符号组成的代码。输入码被接受后就由汉字操作系统的“输入码转换模块”转换为机内码,与所采用的键盘输入法无关。机内码是汉字最基本的编码,不管是什么汉字系统和汉字输入方法,输入的汉字外码到机器内部都要转换成机内码,才能被存储和进行各种处理。