YUKI icon indicating copy to clipboard operation
YUKI copied to clipboard

建议:增加OCR功能

Open hzeng1998 opened this issue 5 years ago • 2 comments

不知道作者有没有 OCR 相关的计划,如果有并且需要人手的话,我可以参与进来 如果目前没有开发相关功能的计划,我这边可能会先开始做一些工作,有空,且急着推gal : ) 目前的想法主要在以下几个点:

OCR

OCR 这一块由于线上的 API 费用过高,期望使用本地的识别模型。 Tesseract Open Source OCR Engine 我觉得是一个不错的选择,理由如下:

  • 开源而且轻量
  • tesseract.js 为上述 OCR 引擎的 JS 封装,简单尝试过,发现处理速度尚在可接受的程度,如果开发可采用该库进行开发,无需进行二次封装
  • 如果 galgame 奇奇怪怪的字体导致文字识别效果不理想,可以进行字体微调,4.x 引入了 LSTM ,根据字体微调之后我觉得可以期待能够处理绝大部分厂商的 galgame(或许并不需要这一步

翻译

翻译可以走现有的翻译流程,复用词典、注音、线上API等功能

界面

界面个人比较倾向有道词典的拍照翻译界面,如下图 但是 背景色和前景色进行互换 ,只绘制选区,使得选区可以持续悬浮在 galgame 的游戏文字框上,当选取内文字改变时,触发 OCR 与翻译流程:

image

开关

希望尽可能不破坏现有设计,开关目前设计应当会采用全局快捷键或者 config 文件的方式,从而不改变现有 UI

hzeng1998 avatar Apr 09 '20 16:04 hzeng1998

但配合特殊码与去重文本可以应对大部分的gal了

123456ds avatar Apr 20 '20 02:04 123456ds

OCR如果作者能一直弄下去应该是必做功能吧。。 如果有OCR的话,就能翻译漫画了吧2333

ParanoiaIsGreat avatar May 03 '20 02:05 ParanoiaIsGreat