或許有人會覺得一個台語都講不流暢的人去學台語輸入法做啥?不過對我來說有台文才是台語能否存活的關鍵。當初改用 firefox 就是為了數位化讀寫有調號的台文,在許多補充的 Unicode 都還沒字體前,我已嚐試過各種台文輸入法。不論是教羅、TLPA、POJ、普實台文(到現在還不了解普實在哪)、台語注音等,各種輸入法我都試過,但是都用不順手。
主要的原因是許多輸入法以打入台語羅馬字、輸出漢字為為重心。對像我這種會打漢字拆字輸入法(我學的是嘸蝦米),加上台語本來就講不好,台文更是嬰兒學步的人而言,用羅馬字打出漢字的功能意義不大。反而是能讓我打出帶調號的羅馬字才是我最需要的台語輸入法功能。
民進黨執政下的教育部對台灣各種國語的保存花了很多心思,除了訂定台羅外,也開發出了教育部臺灣羅馬字拼音輸入法。這個輸入法好用是好用,但是存有兩個問題。第一、在我的 Windows XP 上不知為何其慢無比。第二、政府用了人民的稅金開發出來的成品,雖然免費供人民下載,但是卻不是當初開發前所說的 Open Source Software,頂多算個 Freeware 而已。其實就算不想公開程式碼,至少也可以公開輸入法字表的 .cin 檔。對此人有至信教育部,但是被官腔打了回來。
教育部的輸入法如果電腦高級的話,在 Windows 和 Mac 版跑起來不會有太大問題。但是如果你電腦記憶體不大就得忍受每次切到該輸入法就 lag 的情況。若你用的是 Linux 類的系統,而又不喜歡 SCIM ,是台灣人自行開發的 gcin 用戶的時候,教育部附的「Linux版」也是毫無用處。
如果你是 Windows 用戶,網路上已經有近乎完美的台文輸入法。那就是信望愛的FHL台語文輸入法(Faith Hope Love,怎麼不用SBA?)。在 Windows 下該輸入法不但是任意切換為教羅或是台羅出字,其漢羅版本甚至可以即時改變先出羅馬字或是先出漢字。
這麼完整的台文輸入法,真的台文使用者的福音。台灣這些基督教與天主教對保存台灣各種母語的用心往往讓人動容。但是…… Linux 的檔呢?在信望愛台語文輸入法的「漢羅說明書」中偷夾帶了一個 cin 檔。不過也是以輸出漢字的功能為主。
於是乎 Linux gcin 上就只剩下 xcin 時代留下來的 TLPA 輸入法 、台語注音文、普實台文、KKS台羅漢羅台語輸入法(另有教羅版)、KSS台羅客語輸入法(另有教羅版)。絕大多數不是非主流的台語拼音,就是以輸出漢字為主。
最後我找到了「也輕鬆」YKS教羅漢羅輸入法、YKS台羅漢羅輸入法。兩個檔也是在信望愛的網站找到的。不過不知道是誰撰寫的,但是多少和信望愛的輸入法有點關係的樣子。這一個輸入法的 cin 檔裡就很明顯有支援直接輸出帶調號羅馬字。
不過在用 gcin2tab 轉檔成 gcin 可以使用的檔案時,我遇上了一個困難。YKS裡有些字詞的編碼超過了 gcin 限制的 10 碼(不知道 gcin 限制這個幹麼)。所以我只剩兩種選擇,一是勉為其難改用中國的 SCIM。另外就是把 YKS 超過十碼字詞刪除。除非直接把兩字以上的詞全刪,不然兩者都是很大的工程。於是我想不如自己動手編 cin 檔算了。
既然要寫自己的台文輸入法,就要先思考「台文輸入法應俱備的條件」。究竟要俱足哪些功能才能稱上是一個好用,值得大家去學習的台文輸入法?我個人的看法如下:
一、兼容現有羅馬字方案:
這點很重要。許多台語能力較佳,應該站在前頭帶領台文復興的人反而視學台文為畏途。原因就是台文羅馬字遲遲沒有共識。想學之前光是比較各種羅馬字的優缺就眼花撩亂,加上輸入法通常都選邊站,學了又有可能找不到自己適用的輸入法,難免讓人裹足不前。
一個好的台文輸入法應該兼容多種羅馬字拼法。比如教育部的輸入法會將所輸入的 POJ 與 TLPA 自動轉換成台羅。當輸入 goa2 時,出字是 guá。輸入 chhiann2 時,出字是 tshiánn 或是 tshiáⁿ。理想的台文輸入法應該能在設定中可以選以何種羅馬字規格輸入,甚至可以自訂以另一種羅馬字輸出。如此一來大家可以放心的選一種羅馬字學習,以後若需要另外學習一種羅馬字,配合輸入法的這項功能也會變得容易許多。
這點在 Windows 上較容易實現。gcin 目前僅有注音、詞音有較多自訂功能。其它輸入法只是改自很陽春的 cin 檔。如嘸蝦米原本有四種模式,並可同音查字、注音查字、Wild Card查字等功能,最後 gcin 裡的蝦米只能把四種模式全擠進一個 cin 檔中再轉檔。希望 gcin 能向逼進 Mac OS X 的輸入法的功能發展下去。
二、兼容「怎麼唸就怎麼打」:
不論是用哪一種羅馬字,一個理想的台文輸入法都應該支援怎麼唸就怎麼輸入。比如「自然」每字單獨唸為自chū、然jiân。但是當成一個詞的時候,就會出現台語特有的變調,而唸成chù-jiân。該如何輸入應給用戶自行選擇。選項有四:a、輸入口語的chù-jiân,出字台文的chū-jiân。
b、輸入口語的chù-jiân,出字口語的chù-jiân。
c、輸入台文的chū-jiân,出字台文的chū-jiân。
d、輸入台文的chū-jiân,出字口語的chù-jiân。
事實上簡化一下就是,一個選項不論怎麼打都出台文正寫,另一個選項不論怎麼打都出口語音。
三、兼容調號輸入習慣與順序:
多數台灣人學電腦後的輸入法初體驗通常都是微軟的注音或新注音。因此大部份的人很習慣先打念法再打調號。比如輸入 jian5 ,就出「jiân」字。不過台文輸入法另有許多不同的習慣。一種是順序上的不同。
如教育部的輸入法就支援 ji5an 或 jia5n 的打法。另一種是符號上的不同,有的人認為應該選長得和調號比較像的鍵來輸入。因此jiân可能是打成 jian^,或者是打成 ji^an 或是 jia^n。其它如 á 調號就直接打 ' , ō 調號就直接打 = , a̍ 的調號直接打 | 等。結果又有人覺得 ^ 和 | 要多按一次 shift ,不如直接打成 6 和 \ 。
總之理想的台文輸入法就把選擇留給用戶就好了。
四、台羅漢羅兩宜:
雖然我需要的是有調號的台羅輸入法,一個台文輸入法不能直接輸入有調號的台羅對我而言就像被砍掉一隻手。但是以台羅打出漢羅絕對有其必要性。而且可以讓使用者一面學習到台語傳統用詞。最好能像FHL輸入法那樣可以即時切換選字時是台羅在前還是漢羅在前。
除此之外,台羅如何轉為漢羅就是各家台文輸入法可以展現個人設計的地方。目前有幾種方法:
一、像注音一樣,一個字一個字完整把台文+調號打出來,並且逐一選字。這種輸入法以「字」為最大單位。
二、直接輸入不帶調的整個詞,比如直接打入 lomaji 再按空白鍵,就出現「羅馬字」。這種輸入法以「詞」為最大單位。
三、只輸入一個詞中每字的第一字母。比如輸入 lmj 再按空白鍵,即出現「羅馬字」。這也是以「詞」為最大單位。
四、像新注音與自然輸入法一樣,用戶連續以完整台文+調號,一字一字的上字,再讓智慧型台文輸入法選詞,最後再用標點斷句。這種輸入法式是以「句子」當最大單位。比如輸入Lo5 這時候選欄先出「勞」,使用者再輸入ma2 候選自動變成「羅馬」等。
五、開放台語原本沒有的音也能出字:
其實台文字母訂定後,沒有必要限制只能打出什麼。比如英文如果打 teh ,就會直接上 teh,並不會因為沒有這個英文字就不幫用戶出字。如果是錯字,頂多是用戶寫錯字而已。
如果今天用台文的人想寫 Phát 這種不但台語裡沒有,而且不合理的音,就讓人打又有什麼關係?頂多是打錯字而已。開放了之後說不定日後這些不存在的音會有他們自己的發展。語言是活的,可以規範它,不用限制它。
六、兼容客家話與各原住民語:
在設定裡應該也可以選擇做為客家話或是各原住民語的輸入法。台羅當初設計就是為了兼容台灣所有的國語用的。並不是台語專用的羅馬字。不過現階段要做到這點可能比較困難,也較沒有那麼迫切,如果各語音分別成一個輸入法也沒什麼不好。只是能做到這點更加完美就是了。
以上就是我試著編輯 hlim 的起原和理念。hlim 是 hō-ló input method 的縮寫。當然名字已經叫 hō-ló input method ,自然不是上面形容的「理想台文輸入法」。其實目前的想法只是寫一個在 Linux 系統裡的台羅輸入法給自己用而已。剩下的就等寫好再聊吧。
註:這是個人第一篇以 ScribeFire 撰寫的部落格文章。感覺 so so... 最後還出現 javascript 之類的錯誤,不過文章是正常上了。不過編寫的時候會擋住瀏覽器視窗倒是滿討厭的。
註2:後來還是用 Windows Live Writer 改過了… 難道寫 blog 都要回來開 Windows????
留言列表