vscode_english_chinese_dictionary icon indicating copy to clipboard operation
vscode_english_chinese_dictionary copied to clipboard

希望添加音标显示

Open hmilin opened this issue 4 years ago • 11 comments

单词注释详情中能显示单词音标就完美了

hmilin avatar Feb 19 '21 10:02 hmilin

词典源数据 的确有音标,有兴趣搞个 pr 吗?

nobodxbodon avatar Feb 19 '21 16:02 nobodxbodon

音标非常有用,希望有

jrc96 avatar Dec 12 '23 07:12 jrc96

欢迎pr,在json添加音标数据请参考这里

nobodxbodon avatar Apr 08 '24 16:04 nobodxbodon

词典源数据 的确有音标,有兴趣搞个 pr 吗?

@nobodxbodon 看了下音标词库体量太大,如何存放音标词库需要先定好,比如托管在服务器开放一个查询音标的接口

image

image

IOLOII avatar Aug 04 '24 03:08 IOLOII

@IOLOII 如果像之前的 词形变化表 这样将音标数据按照 词:音标 的格式提取出来的话,应该和这个表的体量(3M多)差不多吧?

nobodxbodon avatar Aug 04 '24 04:08 nobodxbodon

那会也看了下,插件中也是分包的很多个词型文件,组合起来也有42MB 你看的2MB,3MB的是拆包的,如果音标也这样去实现,会不会插件整体太大了

image

IOLOII avatar Aug 04 '24 04:08 IOLOII

词典1-15包含了所有词汇的释义。词形变化.ts 一个文件就包含所有词汇的词形变化。当时应该是为了避免重新生成一遍词典并拆分,因此选择单独将词形变化放在一个文件。音标也可试试类似处理。 释义部分拆分为这样大小印象里是因为当时ms插件商店的限制。 为了做到离线词典,自带数据似乎是唯一选项。 所有数据每个会话仅载入一次,个人感觉基本不影响使用。

nobodxbodon avatar Aug 04 '24 05:08 nobodxbodon

哦词形变化仅包含了十万词(因为很多词无变化),那音标数据的确应该大不少,但还是比释义小一些吧。 也可以考虑选取常用的几万词提供音标。

nobodxbodon avatar Aug 04 '24 05:08 nobodxbodon

21万音标.zip

@nobodxbodon 你看下这份文件中的涵盖范围怎样。这是我在词典源数据 中通过其中的ecdict.csv文件生成后查询的数据剔除了无音标和释意后的文件

IOLOII avatar Aug 04 '24 06:08 IOLOII

过滤得挺好。请问第二和四列为何需要呢?

"wireless fidelity","wirelessfidelity","ˈwaɪəlɪs fiˈdeliti","760129"

nobodxbodon avatar Aug 04 '24 07:08 nobodxbodon

一,二列的没有仔细对比,第四列sql count没关系的,删了就可以

IOLOII avatar Aug 04 '24 10:08 IOLOII