首页 理论教育拼音码与计算机导论-计算机导论

拼音码与计算机导论-计算机导论

【摘要】:如果把GB2312—80中的6763个汉字按413个音节平均分配,那么重码率在5个以上。双拼码的57个码元分作声母和韵母两大类。

按汉字拼音规则对汉字进行的编码称为拼音码。

因为凡识字且能正确发音的人基本上都懂汉字读音和拼音的对应关系,所以拼音码有相当的用户使用基础,这是拼音码的优点。

但是,中文不是拼音文字,使用拼音码输入汉字也有许多问题。这主要表现在:汉字的读音都是单音节的,汉语拼音中仅有24个声母和34个实用的韵母,仅能组成413个实用的拼音编码音节。如果把GB2312—80中的6763个汉字按413个音节平均分配,那么重码率在5个以上。如果把全部6万多个汉字按413个音节平均分配,那么重码问题将严重到无法使用。重码率高是拼音码的缺点。

全拼码和双拼码是两种最有影响的拼音码编码方法。拼音码构造的汉字集都是GB2312—80中的6763个常用汉字。

1.全拼码

我们把给汉字编码的拼音、笔形等基本特征信息元素称为汉字编码的码元。把汉语拼音的每个符号都取为码元的汉字编码称为全拼码。全拼码的码元共有25个,除码元符号“ü”外,其他码元符号和键盘符号是一一对应的。码元符号“ü”的键盘符号是“v”。例如,“率”字的全拼码为Iv。

全拼码的击键次数较多。例如,“想”字的全拼码为xiang,用户需击键5次。另外,当出现重码时还需击键进一步做出选择。所以,使用全拼码时用户输入每个汉字时敲击键盘的次数较多。

拼音码的重码率较高。例如,“计”字的全拼码码元为ji,“算”字的全拼码码元为suan,“机”字的全拼码码元为ji。“计”字和“机”字的全拼码码元相同。

用户输入全拼码的码元suan后,可看到如下4个重码:

suan:1酸;2算;3蒜;4狻

用户输入全拼码的码元ji后,可看到如下13屏共118个重码:

ji:1几;2及;3急;4既;5即;6机;7鸡;8积;9记;

1级;2极;3计;4挤;5己;6季;7寄;8纪;9系;

1基;2激;3吉;4脊;5际;6击;7圾;8畸;9箕;

1肌;2饥;3迹;4讥;5姬;6绩;7棘;8辑;9籍;

1集;2疾;3汲;4嫉;5蓟;6技;7冀;8伎;9剂;

1悸;2济;3寂;4忌;5妓;6继;7丌;8乩;9剞;(www.chuimin.cn)

1佶;2墼;3芨;4芰;5蒺;6蕺;7掎;8叽;9咭;

1哜;2唧;3岌;4嵴;5洎;6屐;7骥;8畿;9玑;

1楫;2殛;3戟;4戢;5赍;6觊;7犄;8齑;9矶;

1羁;2嵇;3稷;4瘠;5虮;6芨;7;8暨;9跻;

1跽;2霁;3鲚;4鲫;5髻;6麂;7革;8给;9稽;

1缉;2祭;3期;4其;5奇;6齐;7偈;8诘;9荠;

1 亟

2.双拼码

分析全拼码可以发现以下三点:

(1)拼音由声母和韵母组成,在组成拼音时,声母在前,韵母在后。

(2)拼音符号到拼音音节的组合不是任意的,拼音符号只能组合出有限个拼音音节。例如,拼音符号a,n,g只能组成韵母音节a,an和ang。

(3)音节是拼音的独立使用元素。例如,拼音fang是由声母音节f和韵母音节ang组成的。

双拼码是把声母和韵母中的多个符号用一个键盘符号表示的编码。双拼码共有57个码元,使用了27个键位(除26个字母符号外,增加一个符号“;”)。双拼码的57个码元分作声母和韵母两大类。键位和声母、韵母的对应关系见表4-1。

表4-1 双拼码键位和声母、韵母对应关系表

这样,“想”字的双拼码为xd,“算”字的双拼码为sr。显然,双拼码和全拼码相比,用户的击键次数有了较显著的降低。当然,用户使用双拼码时,必须记住表4-1的键位和声母、韵母对应关系。