OpenCC
OpenCC copied to clipboard
支援香港地區詞轉換
補充 #487,加上香港地區詞轉換
目前只有「幾率」這一個詞轉換的話,不必添加一套轉換配置。這樣帶來的維護成本很高。
在加入香港地區詞前,我們要先定義清楚什麼是香港地區詞。據我認知,香港地區詞有很大一部分是粵語詞,這部分不在OpenCC的目的內。香港的官話詞彙(普通話、國語)則流動性很強,也就是同事接受大陸和臺灣的用法。
香港人真的接受「幾率」這個詞嗎?這要問香港人的意見吧?
先加一個詞只是開始,據我觀察維基百科的港澳繁體版本,認為和中國大陸還是有不少相異之處,尤其外國人名、地名經常有與台灣、中國都不同的譯法(這和粵語肯定有關,但那往往就是當地人最習慣的譯法了)。可以預期還會有不少地區詞可以加。
比較麻煩的是香港詞和台灣詞的轉換要怎麼處理,目前的處理方案會需要先轉中國簡體及地區詞。
既然如此,我們還是需要找到懂得香港用詞的專業者來評判一個標準。在有這一個標準之前,我傾向於不要添加這一套複雜的轉換方案。
香港的譯名問題還跟粵語有關,這部分目前我不準備涉及,否則將會是一個很大的工程。
其它的姑且不論,「幾率」你打算怎麼處理?強迫香港人使用他們並不習慣的詞?
去維基翻一翻,我不相信沒有其他粵語無關且與中國和台灣都不同的港澳地區詞。
據我認知,香港地區詞有很大一部分是粵語詞
這是典型的認知錯誤。香港使用的中文屬於官話白話文,其中的用詞是官話詞;以粵語書寫的文章才會使用粵語詞。
香港地區詞與台灣、大陸都有區別,例如
「網絡」、「寬頻」
「升降機」(指日語 エレベーター)
而不是用「電梯」
當然也有一些粵語音譯詞,以及有一些粵語詞彙進入香港中文,但這些與上面的相比,佔比非常少。
香港的官話詞彙(普通話、國語)則流動性很強,也就是同事接受大陸和臺灣的用法
那是出於禮貌。
可以去瀏覽香港本土網站(指中文版,不是粵語),就會發現與大陸和臺灣的用法都有很大不同。
我的建議:
類似台灣的地區詞轉換功能,加入香港的地區詞轉換。
粵語音譯詞可以暫時不做,但那並非重點,要做的是「寬帶=>寬頻」、「編程語言=>程式語言」、「搜索=>搜尋」、「隱私權=>私隱權」、「服務器=>伺服器」、 「操作系統=>作業系統」、「文件夾=>資料夾」這種。其中有些詞與台灣相同,有些詞與大陸相同(不用轉換),有一些詞是都不一樣的。
@sgalal 港澳畢竟曾經由英國殖民近百年,和台灣、中國大陸累積的普通話詞彙差異是可想而知的。
可以先參考維基百科的港澳繁體詞表和漢語地區用詞差異列表,初步整理一批詞加入,不然只有一條看起來也的確單薄了點。
branch name 沒辦法改,我先參考 @sgalal 列出來的幾個詞加進去。
另一個議題是香港地區詞是否需要像台灣地區詞分成 IT, name, other ... 等部分?