moedict-webkit icon indicating copy to clipboard operation
moedict-webkit copied to clipboard

可以把原住民語也整合到 [萌典] 裡嗎?

Open jwjeng opened this issue 12 years ago • 10 comments

目前的萌典已經整合國、台、客語辭典 甚至有英、法、德文連結 如果能把原住民語也整合進去 那就更理想了

請參考 【原住民族族語線上詞典】http://e-dictionary.apc.gov.tw 目前有雅美語、布農語、太魯閣語、賽夏語、邵語、阿里山鄒語、卡那卡那富鄒語等七部族語詞典

jwjeng avatar Oct 12 '13 15:10 jwjeng

您好,可以請問想整合的方式嗎?使用上想像中的界面會是?

(由於不是漢字書寫,所以檢索上可能要先想想如何呈現。)

另外依照慣例,在實際應用之前,也先請寫封信詢問 http://e-dictionary.apc.gov.tw/Copyright.htm 是否能以 CC 授權,或其他的開放資料方式釋出。

audreyt avatar Oct 12 '13 18:10 audreyt

台灣原住民語屬南島語系,達悟族的達悟語又同本島的原住民語言分屬不同的語群。而萌典目前收錄的國、閩、客語屬漢語語系,這些在語言學上完全不同的分支語言最好不要收錄在同一個辭典中。另外,二者的使用群可能有很大的差異,下載了萌典離線版的用戶是不是會下載到某些自己永遠用不到的資料?

我覺得為原住民語另新建一個辭典專案會是比較合理的方案,還能更有彈性地加上適用於南島語系語言特性的功能,再同英、法、德語對照表的方式連接至原住民語相對應頁面。

照目前「民住民族族語線上詞典」的資料來看,是以現代漢語解釋詞意,能否取得以該原住民語解釋的釋意(或有沒有需要)?使用介面呢?該用漢語還是可切換的原住民語言?

ethantw avatar Oct 12 '13 19:10 ethantw

資料搭載在同一個網站裡並不是問題。離線版要看資料量,如果資料量太大,確實應該另開一支程式。

主要是現有介面要如何讓「想學原住民的漢語使用者」使用,需要想想。

audreyt avatar Oct 12 '13 19:10 audreyt

嘦原住民的文字有配套的输入法, 那么界面上沿用现在的布局没有问题, 否则,就只能是附加的 单向 汉语-> *原住语言 的对照辞典了...

如果目标是帮助学习,那语音资料,可能同释义资料一样重要

2013/10/13 唐鳳 [email protected]

資料搭載在同一個網站裡並不是問題。離線版要看資料量,如果資料量太大,確實應該另開一支程式。

主要是現有介面要如何讓「想學原住民的漢語使用者」使用,需要想想。

— Reply to this email directly or view it on GitHubhttps://github.com/audreyt/moedict-webkit/issues/82#issuecomment-26204745 .

人生苦短, Pythonic! 冗余不做,日子甭过!备份不做,十恶不赦! KM keep growing environment culture which promoting organization be learnning! 俺: http://about.me/zoom.quiet 许: http://creativecommons.org/licenses/by-sa/2.5/cn/

ZoomQuiet avatar Oct 13 '13 03:10 ZoomQuiet

感謝各位先進的回應 沒想到背後還有這麼多問題要考慮

自己想了一下 由於原住民語並沒有對應的中文字 要整合的話 大概只能像英法德語那樣 在查到某中文字後 如果剛好有詞可以對應的話 就再顯示出對應的原住民語拼音說明 然而 這等於是提供「懂原住民與但不懂中文」的人了解那個字的意思 就像英法德語的說明那樣 問題是 這樣的人我想應該是不存在的 就算是原住民裡不認識漢字的老人耆宿 應該也沒法用英文拼音念出那段話 然後再來了解那個漢字的意思

因此小弟以為 提供原住民語詞典的目的 應該在於提供「想學原住民語的人」使用吧? 這個對象應該不僅限於漢人 還包括「想回頭學母語的原住民」 而這應該也是原住民委員會建立這個「民住民族族語線上詞典」的目的 以致裡面還提供線上測驗功能

既然目的是「幫助學習」 誠如 ZoomQuiet 兄所言:「語音資料,可能同釋義資料一樣重要」 因此整合方式建議比照台語和客家語 也就是字詞搜尋時並不提供原住民語說明 (因為沒有人會這樣看,放了也沒意義) 而是改為獨立製作再附加上原住民語的方式 提供各種專有名詞讀法(漢->原)、讀音翻譯(原->漢)等等功能 而且 每一種原住民語都應該獨立製作 而不是像客家語那樣把各地的讀音整合在一起 因為每一種原住民語對同一個東西的念法 甚至整個文法 可能都不太一樣

這麼一來 整個原住民族語辭典的部分規模就變很大 (或許以資料庫容量來看不一定比漢語多,但種類和選項勢必會很複雜) 似乎得考慮獨立製作才行 或者在網頁上可以整合再一起 但離線版應該要可以提供使用者選擇下載那些項目 這樣就不會有像 ethantw 所言:「下載了萌典離線版的用戶是不是會下載到某些自己永遠用不到的資料?」的問題 就算先不考慮原住民語的部分 也許現在也會有人只想下載台語或客家語也說不定

以上是小弟的看法 敬請各位先進指教

jwjeng avatar Oct 14 '13 15:10 jwjeng

我也一直在想 是不是 越南語 (是否可以 / 如何) 併入 萌典

越南語有很高比例(有人說70%)的詞彙,聽起來簡直是中文(他們稱漢越語)

等同中文的,例如: 政治家 (漢越拼音 = chính trị gia) 發音範例: http://zh.forvo.com/word/ch%C3%ADnh_tr%E1%BB%8B_gia/#vi

感覺好像是從古代漢語傳下來的,例如: y như 直接用漢越詞翻譯是 意(y) 如(như)。 但是現在在越文語意比較像是【按造】的意思。 y như 的越南發音範例: http://zh.forvo.com/word/y_nh%C6%B0/#vi

讓人感覺越南語可以跟中文直譯,例如: 國家 = quốc gia (發音: http://zh.forvo.com/word/qu%E1%BB%91c_gia/#vi) 中國 = trung quốc ( 美國 = quốc mĩ (這邊卻又變成倒過來的越文語法)

越文+漢越語的音,例如: 國外 = nước ngoài (外) (nước 是水的越文,不是漢越詞的水thủy) ,不可以說 quốc(國) ngoài(外) 礦泉水 = nước khoáng(礦的漢越詞), 發音: http://zh.forvo.com/word/n%C6%B0%E1%BB%9Bc_kho%C3%A1ng/#vi

最後像, 家,越文卻又不可以直譯為 gia, 要說 nhà(發音: http://zh.forvo.com/word/nh%C3%A0/#vi)

u8621011 avatar Oct 18 '13 07:10 u8621011

好讚呢 原來越南語跟漢語有這樣的相關 這樣過去曾當過中國藩屬的東南亞國家會不會也都有類似現象? 不知道有沒有人知道泰語、印尼語和馬來語的狀況?

不過,如果要搞這麼大的話 大概得先限制一下 至少侷限在 A語 -> 漢語 -> B語 就好 如果 any語 -> any 語 不就會變成中文版的[Google翻譯]了?

jwjeng avatar Oct 23 '13 05:10 jwjeng

Andrew LeeMiniDebConf2013 有分享他目前在做的 TALOS project. 目標是讓原住民語可以在 debian 上使用。或許可以參考他目前已完成的資料。

印象中,原住民的文字是當時教會為了翻譯聖經,用西歐字母組出來了。由於傳教士來自不同的國家,每個原住民語都會有不同的版本。在輸入方面,鍵盤上會有 Compose key 來輔助輸入。這部份不確定是要用特殊鍵盤還是可以用輸入法搞定。

「想學原住民的漢語使用者」這件事,Andrew 目前在教原住民使用 debian,或許可以請他幫忙?不過由於山區網路不穩定,這部份需要 offline 可以使用會比較符合需求。

czchen avatar Nov 13 '13 15:11 czchen

書寫系統可參考http://zh.wikipedia.org/zh-tw/%E5%8E%9F%E4%BD%8F%E6%B0%91%E6%97%8F%E8%AA%9E%E8%A8%80%E6%9B%B8%E5%AF%AB%E7%B3%BB%E7%B5%B1_(%E4%B8%AD%E8%8F%AF%E6%B0%91%E5%9C%8B)

pcchen avatar Nov 22 '13 16:11 pcchen

@glll4678 謝謝您的建議,似乎可以先從這方向整理一點資料。看看有什麼有趣的規律在裡面?

u8621011 avatar Nov 26 '13 02:11 u8621011