discussion icon indicating copy to clipboard operation
discussion copied to clipboard

記錄有關繁化姬的議題或是內容

Results 25 discussion issues
Sort by recently updated
recently updated
newest added

![image](https://user-images.githubusercontent.com/31242196/53681632-46104100-3d27-11e9-9f89-79b3666098ac.png)

功能加強
網頁前端

先前一直盡量以教育部的辭典為標準,以減少無意義的爭論。 直到剛剛有人舉出了這個例子: ![image](https://user-images.githubusercontent.com/31242196/51804290-e6db8e80-2299-11e9-888a-2ddd5da458b5.png) 教育部告訴你,你也可以把「收穫」寫為「收獲」。 http://dict.revised.moe.edu.tw/cgi-bin/cbdic/gsweb.cgi?o=dcbdic&searchid=Z00000129940 「收獲」這個詞,不論是我個人的經驗(國中的字音字形測驗),亦或是網路上的文章,都是告訴著我「收穫」是正確的,而「收獲」是錯別字。實際上,在此之前,我還沒看過任何說法說「收穫」也可以寫成「收獲」...... 因此,我對這個例子挺反感的(就像[三隻小豬是成語](http://dict.idioms.moe.edu.tw/cgi-bin/cydic/gsweb.cgi?ccd=5lquTz&o=e0&sec1=1&op=sid=%22FL00000007461%22.&v=-1)),也就是說,我並未打算因此將「收獲→收穫」的轉換移出錯別字模組。 那樣的話,到底是否是錯別字的標準將成為什麼,似乎成為了我個人的標準。

問題討論
字典

## 為什麼簡體的`象`可能被轉換成`像`? `象` 與 `像` 並非繁簡關係,簡體裡也有 `像` 字。 單純只是因為我在簡體內容裡挺常看到 `像` 被寫為 `象` ,所以繁化多了這類的轉換。 ## 遇到了什麼問題? ![image](https://user-images.githubusercontent.com/31242196/51926233-cba08880-242b-11e9-8b3a-554e3956bb4b.png) 在一般性的文章或對話中,我假設了簡體的 `象` 作為 `像(like)` 解釋的可能性遠高於作為 `象(elephant)` 解釋。而當這個 `象` 是當成動物解釋時,例如 `非洲森林象` ,裡頭的 `象` 可以當成 `像(like)`...

問題討論
繁體化

最近在差異比較中發現:![一支雞腿?一隻雞腿?](https://user-images.githubusercontent.com/31242196/38048988-8a7a524c-32f9-11e8-9490-8b49d6832519.png) - 有人提到 `支` 是指棒狀物,因此是 `一支雞腿` 。 - 有人提到用台語辨別, `支(gi1)` 、 `隻(jia4)` ,因此是 `一支雞腿` 。 但若從以上的觀點, `一隻手` 或許應該寫為 `一支手` (但我很少見到有人寫 `一支手` )。 究竟??? --- - 一`隻`箭、一`支`箭、一`枝`箭? - 台灣的法律條文使用 `槍枝` 一詞...

問題討論

![image](https://user-images.githubusercontent.com/31242196/34796756-7d95396a-f691-11e7-9d4c-7875a340b33f.png) 如圖,進行 `台灣化` 時, `不` 被認為是句尾,而被誤轉換成了 `嗎` 。

演算法

![image](https://user-images.githubusercontent.com/31242196/43359093-73e460b4-92cf-11e8-8b63-240506c1f417.png)

功能加強

# 錯誤範例 ASS 字幕: - (X) Dialogue: 0,0:00:42.32,0:00:48.84,*Default,NTP,0000,0000,0000,,明治制{\fsp}藥 - (O) Dialogue: 0,0:00:42.32,0:00:48.84,*Default,NTP,0000,0000,0000,,明治製{\fsp}藥 # 解決思路 進行 `繁體化(簡體化亦同)` 後,排除掉模組的影響,文字的總字數應與轉換前維持相同。 因此, ASS 的轉換流程可以是: `移除 ASS tags` → `繁簡化` → `加回 ASS tags` →...

- 最近發現有個簡體字幕裡把 `开` 打成了 `幵` ,應該是來自 OCR 的錯誤。 由於 `幵` 極度不常用,繁化時強行轉換為 `開` 不會時常造成問題。 - 類似問題在繁體字幕中也有 `千` 被打成了 `干` ,並且可能不容易被看出來。 上述兩者現歸類於 `錯別字修正` 模組中。 --- - 英文中則有 `i` (小寫I) / `l`(小寫L) /...

轉換器

某些字體是專門為日文設計的,例如 `DFクラフト遊W5` 。 能否可以維護一張日文專用字體列表,用來自動保護字幕中的日文? 字幕組是否也可能將日文字體用在一般中文字幕上?

問題討論
演算法
日文