Tao Wang
Tao Wang
`librime-data-terra-pinyin` 包中的内容是: ```shell /usr/share/doc/librime-data-terra-pinyin/changelog.Debian.gz /usr/share/doc/librime-data-terra-pinyin/copyright /usr/share/rime-data/build/terra_pinyin.prism.bin /usr/share/rime-data/build/terra_pinyin.reverse.bin /usr/share/rime-data/build/terra_pinyin.schema.yaml /usr/share/rime-data/build/terra_pinyin.table.bin /usr/share/rime-data/terra_pinyin.dict.yaml /usr/share/rime-data/terra_pinyin.schema.yaml ``` 这里面有 `terra_pinyin.reverse.bin` ,这个文件不是用来反查的么?
是的,我注意到了,因为更换了字体后,导致了汉字的大小发生了变化,所以就超了。这部分代码我已经修正了,项目页面的图片已经更换了。  代码已经改了,但是,pypi 里还没发布新的版本,这两天我发个新的版本。
字体的问题,可以安装一下 fonts-noto-cjk fonts-anonymous-pro 字体。 如果是 ubuntu 的话可以: ```bash apt install fonts-noto-cjk fonts-anonymous-pro ``` macOS 的话,可以用 homebrew ```bash brew install font-noto-sans-cjk font-noto-serif-cjk font-anonymous-pro ``` 依赖字体的安装,我稍后加到 README 里去。 字体应该还是需要的,model字表覆盖率的图还好一些,下面需要列出不同字表的名称,这部分是中文,用英文也不是不可以,我可以加个参数,或者提示啥的,变成纯英文的图;但是 embedding 的图就没有办法了,因为要在图中画每个token,token中有大量中文,如果全用方块来代替就失去了查看语义关系的意义了,除非目的就是为了生成一个小的缩略图,token用点来表示那种。 稍后我找时间增加一个不依赖中文的生成缩略图的选项,来解决这个问题。
我最近在尝试用阿里的OSS来挂图,为了加速我尝试了一下绑定我自己的域名到OSS加速,我这里测试没有问题,没想到国内会报备案问题的错误。我现在先换到 OSS 自己的域名,速度上会差一些,但是可能访问会好一些。 主要是图越来越大,现在已经1.8GB左右了,之后每个模型图的数量很可能会翻10倍左右(字、词、句)x (除了0,-1 外,还计划画中间4层的图),目前感觉 OSS 可能比较适合国内访问。我先看看能不能解决这个问题,要是比较麻烦的话,可能就要请你帮忙来挂图片了,先谢谢了。