|
《和码输入法》大字库版3.1说明 www.HeZi.net 2006年11月23日 2006年11月23日,和码3.1.2版发布。从3.0版到3.1.2版,有以下改进: 1、增加了单字数目 3.0版中单字的数目是以GB2312为基础的7200字,3.1.2版单字增加至GBK字符集的21003个字。 通过输入0 23,即可调出对话框,选择大字符集,进行输入。 2、增加简单字根 将3.0版码54中简单字根‘丶丶丶’即横着写的三个点,移到53中。 修改‘州洲’的编码:州(53 42)、洲(53 53 42)。 以GB2312的6763个字为范围,前三码受影响的字有(36个):学浮举誉觉兴泶喾黉鲎,应采孚剑搅觅妥舀敛榉爫,验检脸签捡俭险殓硷睑裣莶猃佥糹。 码24中增加‘卝’,例字有:芈卝羋茍羐蝆。 3、增加组合字根
组合字根‘纟马鱼鸟’的繁体‘糹馬魚鳥’都增加为组合字根。
糹:41 43 53;馬:11 31 54 22;魚:45 22 54;鳥烏:45 11 54。
增加组合字根‘一口’(即‘豆’字的上半),放在码33,原因是‘一口’是很常用的部件,如‘感颌给喊词寰橙缳澧寰’等等,但这些字在取三个主码时都只能取到11(一),而没有取到信息量大的部件33(口),为此特别将‘一口’作为组合字根放在码33中。需要拆开取码时为:11
33,作为一整体取码时为:33。
在GB2312的6763个字范围里,有以下字受此改变的影响:
第一码受影响的字(8个):副融豌鬲逼逗豉翮,都做了容错码。 增加组合字根‘水’,放在码53里,需要拆开取码时为:31
53,作为一整体取码时为:53。
在GB2312的6763个字范围里,有以下字受此改变的影响:
(25个)盥淼,剥颍踏犀逯,泰浆绿碌暴氯腺漾荥傣禄墀滕樨黍脲渌泶
4、少数字(部件)的编码说明
‘門’作部首的字有107个如:聞閂閅閆閇閈開閕閛闖闒闂闟䦛闀閮閠閏等等。 ‘亞’的编码定为:11 31 33 31; 相似的字有: 鄳黽斲琧堊亞畱蝁鼆鼂蠅繩譝鱦僶澠憴鬭鬬鵶惡俹啞埡婭孲弬掗椏氬瘂稏錏駵竈桺丣黿鼀鼁鼃鼄鼅鼇鼈鼉鼊鼌龜龝龞蘒 5、减少组合字根 3.0版以及以前的版本中,组合字根的选取是尽量多地包含常用的偏旁部首,如:西阝尸弓车扌田虫夕久鬼舟穴等。 由于这些组合字根的选与不选,只对极少数单字的取码有影响。而组合字根多了,会使字根表复杂难记一些,再一在单字取码过程中,多了一个考虑的因素。因此3.1版中,尽量少地选用组合字根。 3.1版对组合字根做了以下9点改动。
6、定义‘字块’ 和码中,字块一般是指由两个或多个单笔画组成的汉字常用构字部件。也就是一个单笔画一般不作为一个字块,但允许有特殊情况,如‘虱’字中的‘⺄’就可以作为一个块看待。 7、增加非规则编码 和码汉字字形编码的目的,是取码合理自然的要求下,使前三个码提取单字主要的字根与字形信息,和码的编码规则是为了达到这个目的,依据汉字的字形特点,制订并借助的手段。 但汉字是复杂多样的,总有少数字依照规则编出的码,与编码的目的要求不合。这是需要正面认识看待的实事。为此和码对这些字进行非规则编码。 “发两妻鲁瓦鹤”6个字,如果按规则编码,就很不自然。在3.0版中对“两”已做了非规则编码,3.1版中将其余5个字也做非规则编码。 发(31 41 14 51),两(11 32 43 43),妻(21 13 44 31),鲁(45 11 35 22),瓦(11 31 12 51),鹤(52 42 45 55)。 因此和码的编码以取码的合理自然,为最重要的准则。 8、对词组进行了增删,对部分词组进行了排序。
和码作者:欧阳贵林 |
||||||||||||||||||||||||||||||||||||||||||