持續更新!呢版係我諗到乜就寫乜嘅,一次可能淨係會寫一小部份,敬請留意本頁面嘅持續更新!
我知道好多輸入法嘅運作原理,但可以流利用到嘅並唔多,嘸蝦米係其中之一(但目前已非本人主力)。喺本人深入嘅研究之下,發現咗呢款輸入法(至少從佢嘅官方材料為出發點)嘅一啲唔完備嘅地方。
字根同鍵位
- 有好多實際上會用到嘅字根,喺官方字根表度未有列出。有啲民間資料會補返呢啲字根。
- 「戶」1、「酉」、「臼」、「卜」等字官方文件聲稱佢哋嘅鍵位係從發音而嚟,但我冇搵到佢哋所依據嘅發音係乜。不過其他嘅音碼其實都冇好明確嘅取碼標準就係喇。
- 「喪」字都有「捨大根而不用」嘅嫌疑(「土口口𧘇」>「十口口𧘇」?),而且唔一定有符合大根原則嘅「容錯碼」。至於「囧」不攞「四」而攞做「囗儿ㄇ」或者「囗八ㄇ」,我哋可以定義「四」內部不可容物嚟解釋。
拆字
- 「主」字,我從來都唔明點解它拆做「丶王」而唔係「亠土」。(五筆同樣都拆做「丶王」,倉頡同行列就都係拆做「亠土」。嘸蝦米同五筆都有齊「丶亠土王」四個字根,點解唔係遵守大字根攞先嘅原則?)
- 嘸蝦米有「亼」字根,但「余舍」又唔用「亼」呢個大啲嘅字根而係拆做「人」。「余」有一個將首碼攞做「亼」嘅容錯碼,「舍」就冇將首碼攞做「亼」嘅容錯碼。更甚的是,官方並冇列出一個「余減走人」嘅字根,而係用「禾」嚟權充,而且補碼要攞做捺而唔係點(如果唔係會變做次選嘅容錯碼)。以上現象全部都可以類推到包含呢啲部件嘅字度。
兩碼字
- 「輿」有一個兩碼打法「CB」。呢個字一般習慣寫「𦥑(臼)」先再寫「車」,拆做「GCEB」,官方碼表亦將「GCEB」列為標準拆法,而「CGEB」為容錯碼。佢嘅兩碼打法「CB」列作「首尾碼」不妥。
- 「辭」字完整拆碼係「ETNL」,亦冇「辭」字嘅簡速字根,官方將兩碼打法「EJ」列作首尾碼疑有誤。
- 「瓜」字最後一筆似乎應該係捺而唔係點,官方碼表將兩碼打法「GA」列作標準取碼不妥。(但係「GN」又同「夾」撞咗,所以「GA」或者可以當硬性編碼留喺度。)
- 其他帶有「瓜」部件嘅字如「孤狐」都有類似問題,補碼作 N 嘅容錯碼擠咗去次選位置。
- 「干」字按標準取碼,只可以拆做「GJ」,冇 V(附加 V 唔係標準取碼,只可以當係附加規則),官方將兩碼打法「GV」列作(標準取碼嘅)首尾碼不妥。
- 「艦」字嘅兩碼打法「GF」,官方列作「發音+尾碼」,但佢個發音唔啱。
- 「或」字尾筆應該係右上角嘅點,而唔係橫,官方列作簡速字根嘅規則碼不妥。「武」字都有類似嘅問題,攞做 WE 而唔係 WA。以上字符都唔設末筆作點嘅「容錯碼」。
- 實際上所有帶有「弋」或者「戈」部件嘅字都係咁。官方有提到咁樣嘅一條規則:「凡係帶有『弋』或者『戈』部件嘅字(包括呢兩個字本身),一律拎右上角嘅點先,然後攞『𫠠』或者『𭠍』,最後先至拎位於呢個部件左下方嘅部份。」但考慮到補碼取用嘅模糊性,或者都應該加返咁樣嘅一條附加規則:「凡係帶有『弋』或者『戈』部件嘅字(包括呢兩個字本身)要攞補碼時,一律考慮咗位於左下方嘅部件先,然後先至去考慮喺『𫠠』或者『𭠍』攞補碼」。咁樣一嚟所有帶「弋」或者「戈」嘅字就都完整咁解釋得到喇。
- 有四個字,存在兩種兩碼字嘅打法:力 DX DY、門 MI MY、牙 XP YP、乙 ZL ZZ。官方文檔又話,同一個字掗住兩個兩碼碼位(加 V 嘅唔算)係浪費編碼空間,並以此為據將部份早期版本嘅兩碼字改咗佢(儘管更改兩碼字嘅「常用度」標準可能有主觀之嫌),但又唔知點解留低咗四個「浪費編碼空間」嘅兩碼字喺度。
其他
- 部份字符繁簡體模式分配欠妥。我有打粵語字嘅需求,例如「瞓」、「劏」等字,明明字形上係繁體,嘸蝦米又規定呢個字必須要轉去簡體模式先打到。
「戶」字,喺現代標準漢語同閩南語都係以「h」聲母開頭、標準粵語以「w」聲母開頭,反而係一啲其他嘅南方漢語(從某啲粵語或者客家話方言、到四川湖北湖南嘅方言都有)確實係讀做「f」開頭嘅。 ↩︎