home icon indicating copy to clipboard operation
home copied to clipboard

dict.yaml 为什么要分成两个部分? 明明用yaml就可以

Open alkene0005 opened this issue 7 months ago • 5 comments

不论如何, 至少应该增加如下的配置方式 custom.dict.yaml

name: custom
version: '2023-10-02'
sort: by_weight 
entries:
  - ['t恤', 'ti xu', 999]
  - ['b站', 'bi zhan', 666]

为什么一定要这样 🤔?

答: yaml文件规范是空格为缩进, 而tsv部分以\t为缩进, 导致各种编辑器编辑很恶心

另外: 即便纯用yaml有一些其他缺点, 但为什么不增加支持这种方式呢, 这种纯yaml很适合个人临时增加一些词

alkene0005 avatar May 10 '25 10:05 alkene0005

可以用 dictionary pack 功能把固定不变的部分和常变的部分分开从而加速部署。

ksqsf avatar May 10 '25 11:05 ksqsf

解析巨大的 YAML 文件可能不行。所以不用 YAML 寫碼表。 你可以把它看成文件頭嵌入一段 YAML 配置的 TSV 文件。 TSV 格式比較簡單,順序讀取即時轉換,不需要先解析出一個巨大的列表。 Linux 有命令行工具支持對 TSV 的編輯。很多已有的碼表是類似格式的,容易遷移過來。

lotem avatar May 10 '25 16:05 lotem

可以用 dictionary pack 功能把固定不变的部分和常变的部分分开从而加速部署。

那是什么 我没有查到这个功能

alkene0005 avatar May 11 '25 14:05 alkene0005

解析巨大的 YAML 文件可能不行。所以不用 YAML 寫碼表。 你可以把它看成文件頭嵌入一段 YAML 配置的 TSV 文件。 TSV 格式比較簡單,順序讀取即時轉換,不需要先解析出一個巨大的列表。 Linux 有命令行工具支持對 TSV 的編輯。很多已有的碼表是類似格式的,容易遷移過來。

我平时只维护一个个人使用的小词库, 两种方式可能共存吗, 导入的码表我肯定不会去管他, 也不在乎他是什么格式, 但是我日常维护的"很个人"的词却是频繁改动的

alkene0005 avatar May 11 '25 14:05 alkene0005

可以用 dictionary pack 功能把固定不变的部分和常变的部分分开从而加速部署。

那是什么 我没有查到这个功能

https://github.com/rime/home/wiki/DictionaryPack

ksqsf avatar May 11 '25 14:05 ksqsf

维护小词库有专门的custom phrase功能,见 https://github.com/iDvel/rime-ice/blob/main/custom_phrase.txt

eagleoflqj avatar Aug 14 '25 02:08 eagleoflqj