n6333373

Results 20 issues of n6333373

![image](https://user-images.githubusercontent.com/31242196/34796756-7d95396a-f691-11e7-9d4c-7875a340b33f.png) 如圖,進行 `台灣化` 時, `不` 被認為是句尾,而被誤轉換成了 `嗎` 。

演算法

![image](https://user-images.githubusercontent.com/31242196/43359093-73e460b4-92cf-11e8-8b63-240506c1f417.png)

功能加強

# 錯誤範例 ASS 字幕: - (X) Dialogue: 0,0:00:42.32,0:00:48.84,*Default,NTP,0000,0000,0000,,明治制{\fsp}藥 - (O) Dialogue: 0,0:00:42.32,0:00:48.84,*Default,NTP,0000,0000,0000,,明治製{\fsp}藥 # 解決思路 進行 `繁體化(簡體化亦同)` 後,排除掉模組的影響,文字的總字數應與轉換前維持相同。 因此, ASS 的轉換流程可以是: `移除 ASS tags` → `繁簡化` → `加回 ASS tags` →...

- 最近發現有個簡體字幕裡把 `开` 打成了 `幵` ,應該是來自 OCR 的錯誤。 由於 `幵` 極度不常用,繁化時強行轉換為 `開` 不會時常造成問題。 - 類似問題在繁體字幕中也有 `千` 被打成了 `干` ,並且可能不容易被看出來。 上述兩者現歸類於 `錯別字修正` 模組中。 --- - 英文中則有 `i` (小寫I) / `l`(小寫L) /...

轉換器

某些字體是專門為日文設計的,例如 `DFクラフト遊W5` 。 能否可以維護一張日文專用字體列表,用來自動保護字幕中的日文? 字幕組是否也可能將日文字體用在一般中文字幕上?

問題討論
演算法
日文

![image](https://user-images.githubusercontent.com/31242196/38041174-a499fe90-32e3-11e8-8e12-1da9fbc4038e.png)

繁體化
轉換器

大致上為 `出發`, `走吧`, `開始` 之類的意思,但單一地轉換為其一又容易不符合用法習慣... ## 一些例外 - 走起路來 - 走起秀來 - 走起XX風 - 走起XX流 - 走起XX路線

字典
台灣化

`保質期` 的意義較接近 `賞味期限` , 但 `賞味期限` 用在非食品上又很詭異。 目前暫時維持 `保質期` → `保質期` 。 ### 利碧波 「保質期」和「保存期限」定義上不一樣 https://www.thenewslens.com/article/37858 ![image](https://user-images.githubusercontent.com/31242196/32979767-749a919a-cc96-11e7-8123-c6caa4e771d2.png) 保質期、最佳食用日期在台灣又稱「此日期前最佳」 超過這個日期不代表食品壞了;只要打開來沒有腐敗跡象,還是可以食用 保存期限是硬性規定,超過了食品就很可能腐敗 日文的保質期→賞味期限,保存期限→消費期限 類似的觀念:台灣路邊手搖飲的杯子上常常會寫「X 小時內飲用最佳」 這是一種最佳食用期限,但實際上手搖飲的保存期限大約 2~3 天

字典
台灣化

"個中" 在教育部字典( http://dict.revised.moe.edu.tw/cgi-bin/cbdic/gsweb.cgi?o=dcbdic&searchid=Z00000068416 )查有,而 "箇中" 在教育部字典查無。 ![image](https://user-images.githubusercontent.com/31242196/29563202-1f2e0d98-876f-11e7-9004-2b3553dc9653.png) "箇" 在教育部字典中( http://dict.revised.moe.edu.tw/cgi-bin/cbdic/gsweb.cgi?o=dcbdic&searchid=W00000068448 )表示為 "個" 的異體字。 教育部似乎意圖推廣「個中」。 於是,繁化姬在進行繁化的時候,應該要將所有 "箇" 直接轉換為 "個" ? (除了 "箇舊縣" 為四川地名。)

字典
繁體化

這個轉換是曾經存在的,只是後來我移除了。 移除的理由: - 改成 `我` 我覺得失去了發言者的氣質。例如 `狼與辛香料` 裡的 `赫蘿` 。 - `咱` 轉換成 `我` 我想語意上應該是沒什麼例外。因此需要此轉換的人,加到 `自訂轉換` 中應該是安全的。 加入的理由: - 同理,不需要此轉換的人,可以把 `咱` 加入 `自訂保護` 中。 你覺得呢?

字典
台灣化