Dvorak键盘布局下的中文输入(二)

2009-10-08 20:26:06
按照上一篇文章列出的计划,这一次摸索着对Dvorak键盘布局下的双拼输入做一点改进。

什么是双拼?

为了克服全拼输入击键太多的麻烦,将汉语拼音中的多字符声母(zh、ch、sh)、韵母(如ang)及复合韵母(如iong)用一个按键代替。这样,输入一个汉字的读音只需要两次击键,因此称为双拼。

使用双拼输入可以减少击键次数,但需要记忆键位对应法则。目前双拼的键位对应法则并不统一,拼音输入法软件厂商有各自的标准,常见的包括自然码、微软、紫光、智能ABC、中文之星、拼音加加等等。在这其中,自然码应用最为广泛(微软为自然码所授权),因此,本文将自然码双拼作为主要改造对象。需要说明的是,在常用的拼音输入法中,搜狗拼音(Windows平台)和FIT(Mac平台)均支持自定义双拼键位。

自然码双拼定义如下:

[方案]
方案名称=自然码

[零声母标识]
=O

[声母]
# 双拼编码就是它本身的声母不必列出
ch=I
sh=U
zh=V

[韵母]
# 双拼编码就是它本身的韵母不必列出
ai=L
an=J
ang=H
ao=K
ei=Z
en=F
eng=G
er=R
ia=W
ian=M
iang=D
iao=C
ie=X
in=N
ing=Y
iong=S
iu=Q
ng=G
ong=S
ou=B
ua=W
uai=Y
uan=R
uang=D
ue=T
ui=V
un=P
uo=O


为了得到更普遍的统计结果,这次测试增加了样本文字数量,内容为旧样本加半部《围城》,总字数约为二十三万。

首先来看使用全拼输入法的情况:
结果基本与前文相同,需要输入的汉语拼音字符总数(不包括选字)为594352。 下面是使用自然码双拼的的情况,需要输入的字符数(不包含选字)为400838:
同全拼输入法相比,自然码双拼需要输入字符总数显著减少。同时在Qwerty布局下,按键也更集中于键盘中排,不过仍然低于Dvorak,差距约为8%。当然,自然码双拼的设计过程不可能考虑到了Dvorak布局,这样的结果是一个巧合。 那么,能否针对Dvorak键盘布局进一步优化呢?当然可以,其中的一个方案列在了下面: [声母] # 双拼编码就是它本身的声母不必列出 ch=V sh=U zh=I [韵母] # 双拼编码就是它本身的韵母不必列出 ai=D an=P ang=H ao=K ei=Z en=T eng=G er=R ia=W ian=N iang=L iao=Y ie=X in=M ing=C iong=S iu=Q ng=G ong=S ou=B ua=W uai=C uan=R uang=L ue=F ui=I un=J uo=O 通过对文本中多字符声母和韵母出现的次数进行统计,以出现次数多的安排在键盘中排或者上/下排食指处,次数少的则置于上/下排无名指或小指处为原则,在这一方案中,我对P、G、I、D、H、T、N、V这八个次数差异最大的按键进行了重新定义。
由于并未对所有按键以使用次数为依据重新定义,所以效率并非最佳(例如中排提升不足5%),然而这种方案在很大程度上保留了自然码键位易于记忆的优点,降低了学习的难度。