下围棋的时候,双方默不作声,只能靠手不断地放置棋子来决斗,称之为“手谈”。实则这个词用在人和电脑的交流上更加贴切,在语音等新式输入没有普及之前,我们只能靠键盘、鼠标与电脑“手谈”。而关于中文输入法的发展,还颇有些曲折呢。
全键盘之梦
电脑是外国人发明的,所以电脑键盘的设计完全不会照顾汉字系统。而只有26个英文字母的键盘,要怎样才能输入数以万计的汉字呢?Google日本曾经发布过一个愚人节玩笑,表明制作出涵盖所有日文假名、汉字、颜文字的“日文键盘”,这套如同古代活字印刷的排字盘的输入系统,看起来令人生畏,却也道出了包括汉字在内的所有表形文字输入的困境。

图1 Google日本愚人节玩笑发布的“日文键盘”
实则全键盘输入汉字,的确 是开始时候的解决方案之一。上世纪80年代曾经流行过的“整字大键盘”输入法,在输入界面可以从两千多个常用的汉字中直接选择要输入的字。这一方案虽然直观,但是输入效率较低。

图2 整字大键盘
还有一种方案,通过“主-辅”键盘的设计,对上述的全键盘有所改善。它将全键盘缩小为200多个主键,每个主键上整合9到16个汉字,这样整体字数与全键盘相近。输入的时候,按一次主键,再通过辅助键盘(相应的有9到16个键)选择这个主键上的具体汉字。这一方法有所优化,但依旧很不方便。

图3 主辅键盘示意图

图4 我国台湾省国立交通大学曾经研制的一套试验汉字键盘
最早的汉字输入法
改造键盘之路被证明很难行得通,于是中国人另辟蹊径,充分利用英文键盘,通过对每个汉字进行编码(列如“汉”字的五笔字型码是英文“ic”),从而将所有汉字容纳于26个字母之中。实则这一思路可以上溯到1880年,当时开始流行电报,为了能够发送中文电码,于是为每个汉字编制了一个4位数的数字编码,可以从0001到9999表达一万个汉字。
当然,电报码根本无法记忆,直接作为输入法是行不通的,于是有人开始设计便于记忆的汉字编码。真正意义上有实用价值的汉字输入法,应该是1976年由朱邦复在台湾省发明的仓颉输入法,而不是大家一直认为的王永明五笔输入法。仓颉输入法采用的是拆字的输入方式,依据形码规则,重码率极低,而且在掌握一套口诀后,也超级好记忆,大大提高了汉字输入的效率。不过仓颉输入法主要针对的是繁体字,在大陆简体汉字最早的形码输入法,那就要数大名鼎鼎的五笔字型了。

图5 仓颉输入法键盘

图6 仓颉输入法拆字示例
五笔字型逞英雄
也许目前已经很少有人知道,由于计算机的普及,汉字曾经经历过一场很大的危机。上世纪七、八十年代,当时要向电脑中输入汉字还需要配置专用的“汉字键盘”,导致输入效率极为低下。那时就曾有部分专家学者提议撤销汉字,全民改用汉语拼音。
正是王永民在1978至1983年的五年间研发出的五笔字型,彻底解决了汉字输入的困境,当时在世界上五笔字型首破汉字输入每分钟百字大关,引起轰动。
五笔字型将汉字笔划分成横(同提)、竖、撇、捺(同点)、折五个区,再按必定的规律将字根或码元分布到标准键盘的25个英文字母键上。由于字根对中国人来说超级熟悉,再加上编码很短(最长的四码,最短的只有一码),所以记忆起来很方便,经过一段时间训练,几乎每个人都可以快速输入。

图7 五码五笔字根分布图
拼音输入法的崛起
按常理来说,拼音输入法不需要额外的记忆,拼音与英文字母也能一一对应,应该是最理想的输入法,但它一开始的发展却超级不顺利,在与五笔输入法的大战中更是溃不成军。究其缘由,重码是主要的祸首,由于汉字的同音字太多了,往往同一个拼音会显示十几个甚至更多的同音字来,选择的过程导致输入速度下降,也影响到盲打。
为了扭转这一局势,拼音输入法一直在改善。1993年的中文之星,绝对是当时输入法中的一颗明星,它能边输入拼音边显示汉字,在当时是一个很强的设计。之后,黑马神拼之类的输入法实现汉字整句输入功能,让拼音输入法有了一个质的飞跃,到2000年的智能狂拼的出炉,更是让整句输入如日中天。
实则早在上世纪80年代末,哈工大博士王晓龙申请863课题的关于汉语分词的研究,就已经奠定拼音整句输入的理论基础。而微软也在Windows 95中文版内置的微软拼音输入法中,开始支持整句输入,只是效果不是很好。
直到近两年的云端技术的兴起,拼音输入法终于扬眉吐气,压下了五笔字型的势头。云输入法的优势就在于,它有巨型的语料库技术支持,我们只需要输入简单的几个拼音,它就可以通过智能算法,从语料库中快速匹配出准确的答案。至此,五笔字形在速度上已无优势,没有人下功夫去学它也就情有可原了。
迄今为止,输入法可谓是“万码奔腾”,而许多新的输入方法,列如语音输入、扫描输入等技术也是层出不穷,我们与电脑的交流更加顺畅了。欢迎大家继续关注本期大话题中其他的输入相关的内容。


















暂无评论内容