或許有人會覺得一個台語都講不流暢的人去學台語輸入法做啥?不過對我來說有台文才是台語能否存活的關鍵。當初改用 firefox 就是為了數位化讀寫有調號的台文,在許多補充的 Unicode 都還沒字體前,我已嚐試過各種台文輸入法。不論是教羅、TLPA、POJ、普實台文(到現在還不了解普實在哪)、台語注音等,各種輸入法我都試過,但是都用不順手。

 

  主要的原因是許多輸入法以打入台語羅馬字、輸出漢字為為重心。對像我這種會打漢字拆字輸入法(我學的是嘸蝦米),加上台語本來就講不好,台文更是嬰兒學步的人而言,用羅馬字打出漢字的功能意義不大。反而是能讓我打出帶調號的羅馬字才是我最需要的台語輸入法功能。

 

  民進黨執政下的教育部對台灣各種國語的保存花了很多心思,除了訂定台羅外,也開發出了教育部臺灣羅馬字拼音輸入法。這個輸入法好用是好用,但是存有兩個問題。第一、在我的 Windows XP 上不知為何其慢無比。第二、政府用了人民的稅金開發出來的成品,雖然免費供人民下載,但是卻不是當初開發前所說的 Open Source Software,頂多算個 Freeware 而已。其實就算不想公開程式碼,至少也可以公開輸入法字表的 .cin 檔。對此人有至信教育部,但是被官腔打了回來。

 

  教育部的輸入法如果電腦高級的話,在 Windows 和 Mac 版跑起來不會有太大問題。但是如果你電腦記憶體不大就得忍受每次切到該輸入法就 lag 的情況。若你用的是 Linux 類的系統,而又不喜歡 SCIM ,是台灣人自行開發的 gcin 用戶的時候,教育部附的「Linux版」也是毫無用處。


  如果你是 Windows 用戶,網路上已經有近乎完美的台文輸入法。那就是信望愛的FHL台語文輸入法(Faith Hope Love,怎麼不用SBA?)。在 Windows 下該輸入法不但是任意切換為教羅或是台羅出字,其漢羅版本甚至可以即時改變先出羅馬字或是先出漢字。

 

  這麼完整的台文輸入法,真的台文使用者的福音。台灣這些基督教與天主教對保存台灣各種母語的用心往往讓人動容。但是…… Linux 的檔呢?在信望愛台語文輸入法的「漢羅說明書」中偷夾帶了一個 cin 檔。不過也是以輸出漢字的功能為主。

  
  於是乎 Linux gcin 上就只剩下 xcin 時代留下來的 TLPA 輸入法台語注音文普實台文KKS台羅漢羅台語輸入法(另有教羅版)、KSS台羅客語輸入法(另有教羅版)。絕大多數不是非主流的台語拼音,就是以輸出漢字為主。


  最後我找到了「也輕鬆」YKS教羅漢羅輸入法YKS台羅漢羅輸入法。兩個檔也是在信望愛的網站找到的。不過不知道是誰撰寫的,但是多少和信望愛的輸入法有點關係的樣子。這一個輸入法的 cin 檔裡就很明顯有支援直接輸出帶調號羅馬字。

 

  不過在用 gcin2tab 轉檔成 gcin 可以使用的檔案時,我遇上了一個困難。YKS裡有些字詞的編碼超過了 gcin 限制的 10 碼(不知道 gcin 限制這個幹麼)。所以我只剩兩種選擇,一是勉為其難改用中國的 SCIM。另外就是把 YKS 超過十碼字詞刪除。除非直接把兩字以上的詞全刪,不然兩者都是很大的工程。於是我想不如自己動手編 cin 檔算了。


  既然要寫自己的台文輸入法,就要先思考「台文輸入法應俱備的條件」。究竟要俱足哪些功能才能稱上是一個好用,值得大家去學習的台文輸入法?我個人的看法如下:


  一、兼容現有羅馬字方案:


  這點很重要。許多台語能力較佳,應該站在前頭帶領台文復興的人反而視學台文為畏途。原因就是台文羅馬字遲遲沒有共識。想學之前光是比較各種羅馬字的優缺就眼花撩亂,加上輸入法通常都選邊站,學了又有可能找不到自己適用的輸入法,難免讓人裹足不前。

     
  一個好的台文輸入法應該兼容多種羅馬字拼法。比如教育部的輸入法會將所輸入的 POJ 與 TLPA 自動轉換成台羅。當輸入 goa2 時,出字是 guá。輸入 chhiann2 時,出字是 tshiánn 或是 tshiáⁿ。理想的台文輸入法應該能在設定中可以選以何種羅馬字規格輸入,甚至可以自訂以另一種羅馬字輸出。如此一來大家可以放心的選一種羅馬字學習,以後若需要另外學習一種羅馬字,配合輸入法的這項功能也會變得容易許多。

    
  這點在 Windows 上較容易實現。gcin 目前僅有注音、詞音有較多自訂功能。其它輸入法只是改自很陽春的 cin 檔。如嘸蝦米原本有四種模式,並可同音查字、注音查字、Wild Card查字等功能,最後 gcin 裡的蝦米只能把四種模式全擠進一個 cin 檔中再轉檔。希望 gcin 能向逼進 Mac OS X 的輸入法的功能發展下去。


  二、兼容「怎麼唸就怎麼打」:


  不論是用哪一種羅馬字,一個理想的台文輸入法都應該支援怎麼唸就怎麼輸入。比如「自然」每字單獨唸為自chū、然jiân。但是當成一個詞的時候,就會出現台語特有的變調,而唸成chù-jiân。該如何輸入應給用戶自行選擇。選項有四:

a、輸入口語的chù-jiân,出字台文的chū-jiân。

b、輸入口語的chù-jiân,出字口語的chù-jiân。

c、輸入台文的chū-jiân,出字台文的chū-jiân。

d、輸入台文的chū-jiân,出字口語的chù-jiân。

 

  事實上簡化一下就是,一個選項不論怎麼打都出台文正寫,另一個選項不論怎麼打都出口語音。

 

  三、兼容調號輸入習慣與順序:


  多數台灣人學電腦後的輸入法初體驗通常都是微軟的注音或新注音。因此大部份的人很習慣先打念法再打調號。比如輸入 jian5 ,就出「jiân」字。不過台文輸入法另有許多不同的習慣。一種是順序上的不同。

 

  如教育部的輸入法就支援 ji5an 或 jia5n 的打法。另一種是符號上的不同,有的人認為應該選長得和調號比較像的鍵來輸入。因此jiân可能是打成 jian^,或者是打成 ji^an 或是 jia^n。其它如 á 調號就直接打 ' , ō 調號就直接打 = , a̍ 的調號直接打 | 等。結果又有人覺得 ^ 和 | 要多按一次 shift ,不如直接打成 6 和 \ 。

 

  總之理想的台文輸入法就把選擇留給用戶就好了。

 

  四、台羅漢羅兩宜:


  雖然我需要的是有調號的台羅輸入法,一個台文輸入法不能直接輸入有調號的台羅對我而言就像被砍掉一隻手。但是以台羅打出漢羅絕對有其必要性。而且可以讓使用者一面學習到台語傳統用詞。最好能像FHL輸入法那樣可以即時切換選字時是台羅在前還是漢羅在前。


  除此之外,台羅如何轉為漢羅就是各家台文輸入法可以展現個人設計的地方。目前有幾種方法:

 

  一、像注音一樣,一個字一個字完整把台文+調號打出來,並且逐一選字。這種輸入法以「字」為最大單位。


  二、直接輸入不帶調的整個詞,比如直接打入 lomaji 再按空白鍵,就出現「羅馬字」。這種輸入法以「詞」為最大單位。


  三、只輸入一個詞中每字的第一字母。比如輸入 lmj 再按空白鍵,即出現「羅馬字」。這也是以「詞」為最大單位。


  四、像新注音與自然輸入法一樣,用戶連續以完整台文+調號,一字一字的上字,再讓智慧型台文輸入法選詞,最後再用標點斷句。這種輸入法式是以「句子」當最大單位。比如輸入Lo5 這時候選欄先出「勞」,使用者再輸入ma2 候選自動變成「羅馬」等。

 

  五、開放台語原本沒有的音也能出字:


  其實台文字母訂定後,沒有必要限制只能打出什麼。比如英文如果打 teh ,就會直接上 teh,並不會因為沒有這個英文字就不幫用戶出字。如果是錯字,頂多是用戶寫錯字而已。

  如果今天用台文的人想寫 Phát 這種不但台語裡沒有,而且不合理的音,就讓人打又有什麼關係?頂多是打錯字而已。開放了之後說不定日後這些不存在的音會有他們自己的發展。語言是活的,可以規範它,不用限制它。


  六、兼容客家話與各原住民語:


  在設定裡應該也可以選擇做為客家話或是各原住民語的輸入法。台羅當初設計就是為了兼容台灣所有的國語用的。並不是台語專用的羅馬字。不過現階段要做到這點可能比較困難,也較沒有那麼迫切,如果各語音分別成一個輸入法也沒什麼不好。只是能做到這點更加完美就是了。

 

  以上就是我試著編輯 hlim 的起原和理念。hlim 是 hō-ló input method 的縮寫。當然名字已經叫 hō-ló input method ,自然不是上面形容的「理想台文輸入法」。其實目前的想法只是寫一個在 Linux 系統裡的台羅輸入法給自己用而已。剩下的就等寫好再聊吧。


 

  註:這是個人第一篇以 ScribeFire 撰寫的部落格文章。感覺 so so... 最後還出現 javascript 之類的錯誤,不過文章是正常上了。不過編寫的時候會擋住瀏覽器視窗倒是滿討厭的。

 

  註2:後來還是用 Windows Live Writer 改過了… 難道寫 blog 都要回來開 Windows????

hansioux 發表在 痞客邦 PIXNET 留言(5) 人氣()


留言列表 (5)

發表留言
  • 悄悄話
  • 挨滴貨
  • 因為對這幾套輸入法都不太熟,所以很勉強才看完整篇文章...:p

    像我這種會"講"(但跟我父母輩比在生僻字、俚語使用上還是有差距)、但是完全沒接觸過教育部等單位推行的台文"文字"系統的人來說,學這套輸入法能使用到的範圍就顯得有限...
    像我日常生活中幾乎時時刻刻都得用到台語,但文字...則完全用不到=__=

    這不是說台文輸入法就沒有繼續進化的意義,只是必須要有一套公用的文字系統,這樣子無論是否把台文當母語使用的人,應該都會比較好入手啊。

    講到這個,目前台灣用的中文(普通話)文字拼音系統,多數人學習依然以注音符號為主。而非羅馬拼音,我猜測也會造成一定程度的台文推廣阻礙,因為對多數人來說,羅馬拼音跟注音這兩套系統,就文字的表象上還是有段差距存在。

    但這兩套,我覺得其實可以共用才對啊???
  • 還好之前教育部來得及公佈台文羅馬字的標準,並且把台客原住民語都列為國語。不然大概永遠都沒有結果。

    以漢語拼音來說,那是專為北京話設計的系統。對於台灣的hō-ló、客語、各種原住民語都不適用,而且和國際 IPA 的用法差異很大。甚至要拿來台灣用在台灣的華語發音上都可能還需要經過「馴化」。新一代中國人說「為什麼」的時候,為的開頭會有 V 的音不是沒有原因的。如果一直都是這樣講,那 1949 年來台的後移民怎麼不見同樣的口音?

    有學者比較中國《新華字典》(1990年版)和台灣《國語辭典》(1981年版)中3500個常用字的注音,而發現到注音相同的2711個,注音不同或不完全相同的789個。台灣國語和中國普通話有差異的注音佔了將近25%(引自蘇金智 2000)。

    表面上可以共用,但實事上又不太能共用……某些因為特殊因素猛捧漢語拼音的人永遠也不會提到這點,倒是中國那邊的人很努力提到這些(總覺得中國有些學者常會不小心扯到他們自己人的後腿)

    至於注音符號改良版問題在於注音符號不適合當文字,勉強能標音而已。連把注音符號拿來夾漢字寫都覺得很難看了,拼出來時疊成一個一個長方體,要拿來當台文用一點也不恰當。那還不如改造韓國諺文來拼台語。台灣也有人做這方面的研究。

    hansioux 於 2009/06/15 17:34 回覆

  • oakyuan smith
  • 此篇文章, 感覺上有些部分是在說一個台文系統, 而非講一個台文輸入法, 因為不可能有一種輸入法可以用注音.也可以用倉頡, 的道理是一樣的, 不同的輸入系統應用不同的輸入法, 因為 code 不同 ..., 至於其他的觀點, 倒是蠻贊成的
    另外, 想提出一點建議, 就是編輯方便性的問題: mark, copy, paste, and " 漢羅之間轉換的問題 ", 是指輸出以後的轉換而非輸出之前 ...
    Many thanks, your sincerely oakyuansmith 2009/08/28
  • 可能是我用嘸蝦米的原因吧。因為嘸蝦米裡也可以打簡體字,也可以打日文,也可以「注音查字」(其實就是加了注音輸入法)。

    在 Windows 下一個輸入法是可以做到這些的。如果在 Linux 之下,目前不論是 SCIM 或是 gcin 的確做不到這些,可能要重寫一個系統出來。話說回來許多 FHL 台文輸入法的功能就已經不是 gcin 底下掛個 .cin 檔能做得到的。

    至於希望台文輸入法下也能切用拆字輸入法,是因為目前台文輸入皆是拼音輸入法。打羅馬字的時候固然好用,但是要用來打漢字時,對慣用拆字輸入法的人來說時分痛苦。比如 oo 一音,就對應 33 個漢字,若是選字十分麻煩。如果打漢字就要切換到別的輸入法,再轉回來打羅馬字又覺得兩者好像分家了。明明都是台文的一部份啊...

    hansioux 於 2009/08/28 22:55 回覆

  • iago
  • chhiaN-mng 竹板凳的漁瘟 笠/你咁知影

    YKS教羅漢羅輸入法 & YKS台羅漢羅輸入法& FHL-TaigiHakkaIME-Windows-2.0.0

    chit 3 chiong 輸入法的差別ka用法
    唔兜位鴨 , bo kang-khoan

    真多蝦 ,勞力 thank QQ

    話尾
    另外 ,笠/你 e 自我紹介 kong
    板凳被拋入水中後餘溫盡失,還引起漁瘟!
    能逃就快點逃走吧。~ ~
    tse si te kong 啥米代誌leh ?

  • 悄悄話