CautionThis article about discussion on a certain Chinese IME and is not translated in to English yet (and probably never), please refer to the Chinese version instead.
持續更新!本頁面是我想到啥就寫啥的,一次可能只會寫一小部份,敬請留意本頁面的持續更新!
我知道許多輸入法的運作原理,但能流利使用的並不多,嘸蝦米是其中之一(但目前已非本人主力)。在本人深入的研究之下,發現了這款輸入法(至少從其官方材料為出發點)的一些不完備之處。
字根與鍵位
- 有許多實際上會用到的字根,在官方字根表中未有列出。有些民間資料會補回這部份字根。
- 「戶」1、「酉」、「臼」、「卜」等字官方文件聲稱其鍵位乃從發音而來,但我並未找到其所依據的發音為何。不過其他的音碼其實也沒有很明確的取碼標準就是了。
- 「喪」字都有「捨大根而不用」的嫌疑(「土口口𧘇」>「十口口𧘇」?),且不一定有符合大根原則的「容錯碼」。至於「囧」不取「四」而取作「囗儿ㄇ」或「囗八ㄇ」,我們可以定義「四」內部不可容物來解釋。
拆字
- 「主」字,我從來沒有搞懂為什麼它拆的是「丶王」而不是「亠土」。(五筆同樣也拆作「丶王」,倉頡和行列就都是拆作「亠土」。嘸蝦米和五筆都有齊「丶亠土王」四個字根,為何不是遵守大字根先取的原則?)
- 嘸蝦米有「亼」字根,但「余舍」卻不用「亼」這個較大的字根而是拆作「人」。「余」有一個將首碼取作「亼」的容錯碼,「舍」則不設將首碼取作「亼」的容錯碼。更甚的是,官方並未有列出一個「余減掉人」的字根,而是用「禾」權充,而且補碼要取作捺而非點(不然的話會變成次選的容錯碼)。以上現象全部都可以類推到包含這些部件的字上。
兩碼字
- 「輿」有一個兩碼打法「CB」。此字一般習慣先寫「𦥑(臼)」再寫「車」,拆作「GCEB」,官方碼表亦將「GCEB」列為標準拆法,而「CGEB」為容錯碼。其兩碼打法「CB」列作「首尾碼」不妥。
- 「辭」字完整拆碼為「ETNL」,亦不存在「辭」字的簡速字根,官方將兩碼打法「EJ」列作首尾碼疑有誤。
- 「瓜」字最後一筆似應為捺而非點,官方碼表將兩碼打法「GA」列作標準取碼不妥。(但是「GN」又跟「夾」重碼了,所以「GA」也許可以作為硬性編碼留着。)
- 其他帶有「瓜」部件的字如「孤狐」都有類似問題,補碼作 N 的容錯碼被放到了次選位置。
- 「干」字按標準取碼,只能拆作「GJ」,沒有 V(附加 V 不是標準取碼,只應算作附加規則),官方將兩碼打法「GV」列作(標準取碼的)首尾碼不妥。
- 「艦」字的兩碼打法「GF」,官方列作「發音+尾碼」,但其發音不脗合。
- 「或」字尾筆應為右上角的點,非橫,官方列作簡速字根的規則取碼不妥。「武」字也有類似的問題,取作 WE 而不是 WA。以上字符均不設末筆作點的「容錯碼」。
- 實際上所有帶有「弋」或「戈」部件的字都是如此。官方有提到這樣的一條規則:「凡是帶有『弋』或『戈』部件的字(包括這兩個字本身),一律先取右上角的點,然後取『𫠠』或『𭠍』,最後取位於這個部件左下方的部份。」但考慮到補碼取用的模糊性,也許也應該加上這樣的一條附加規則:「凡是帶有『弋』或『戈』部件的字(包括這兩個字本身)要取補碼時,一律先考慮位於左下方的部件,然後才考慮從『𫠠』或『𭠍』取補碼」。這麼一來所有帶「弋」或「戈」的字就都能完整地解釋了。
- 有四個字,存在兩種兩碼字的打法:力 DX DY、門 MI MY、牙 XP YP、乙 ZL ZZ。其官方文檔又說,同一個字佔用兩個兩碼碼位(加 V 的不算)是浪費編碼空間,並以此為據將部份早期版本的兩碼字改掉(儘管更改兩碼字的「常用度」標準可能有主觀之嫌),但又不知為何留了四個「浪費編碼空間」的兩碼字下來。
其他
- 部份字符繁簡體模式分配欠妥。我有輸入粵語字的需求,例如「瞓」(睡覺的意思)、「劏」等字,明明字形上是繁體,嘸蝦米卻規定這個字符必須要切換至簡體模式才能打出。
「戶」字,在現代標準漢語及閩南語均以「h」聲母開頭、標準粵語以「w」聲母開頭,反倒是好些其他的南方漢語(從某些粵語或客家話方言、到四川湖北湖南的方言都有)確實是唸作「f」開頭的。 ↩︎