中文信息处理由于打字机键盘在设计时本身没有考虑汉字输入的问题,输入汉字往往比输入拼音文字困难。由于英文是由26个字母排列组合而成的文字,因此可以简化输入步骤;相比较之下汉字则不能如此,从字形上虽然可以拆解成不同的部分,但是被分成的部首或偏旁数量多,这样不但不能达到简化输入的目的,反而显得更为繁琐,于是从汉字字音上去考虑汉字输入被分成少量的语音元素组合排列,这样可以达到简化输入的步骤。由于是语音输入对汉字的读音必须清楚,某些生僻字或不知道汉字发音的则会很困难,这在一定程度上限制了汉字的输入。汉字没有经过中文打字机的普及,直接进入了电脑中文信息处理阶段。在电脑发明初期曾引起汉字能否适应电脑时代的问题,支持汉字拉丁化的学者甚至以此为理据。[5]
随着各种中文输入法的出现,汉字的计算机输入、存储、输出技术得到了基本解决,大大提高了中文写作、出版、信息检索等的效率。中文输入法有上千种之多,主要包括表音输入和表形输入两类,也有两者兼之的。汉字的语音输入、手写识别和光学字符识别(OCR)技术也已得到广泛应用。
如收录数千字的GB 2312(中国大陆), Big5 及CNS 11643(台湾), HKSCS(香港), JIS(日本),以及收录两万多字的GBK(中国大陆), 国际标准Unicode, ISO 10646等等。在这个过程中,因为技术及其他种种因素,在收录字数,及收录字体等方面或做不同层次的调整。
中国政府为了解决邮政,户籍整理等领域用字的迫切需要,于2000年实行了一个新的汉字编码的国家标准《汉字编码字符集-基本集的扩充》GB 18030-2000,共收汉字27484个。并强制所有在中国大陆地区售卖的计算机产品必须使用这个新官方标准。
汉字编码系统为进行信息交换,各汉字使用地区都制订了一系列汉字字符集标准。
国标码(“国标”是中华人民共和国国家标准的简称)在中国大陆使用。GB2312收录6763个汉字,GBK收录20912个汉字,最新的GB18030收录27533个汉字。
BIG5码。收录13053个汉字。在台湾和香港使用的一字节或两字节编码。
Unicode并不被中国政府很好的接受。中国政府要求在中国大陆出售的软件必须支持GB18030编码。
在国际通信化和软件设计领域,CJK编码收集了汉语、日语、韩语中的汉字集。
前往快乐妈咪APP阅读全文,体验更佳
绑定手机
绑定手机号用来登录和找回密码:
请输入正确的手机号码
请输入验证码
密码须为8-16个字符的字母数字组合
两次输入的密码不一致
绑定成功
现在您可以畅游太平洋网络旗下的所有网站
3s后窗口自动消失...