ThesaurusParser icon indicating copy to clipboard operation
ThesaurusParser copied to clipboard

搜狗、百度、QQ输入法的词库文件的 Java 解析程序,配合 ThesaurusSpider 使用

搜狗、百度、QQ输入法词库解析程序

用Java实现的搜狗(scel)、百度(bdict)、QQ输入法(qpyd)词库文件的解析程序,一种词库文件对应于一个文件夹,对应关系如下:

  • Baidu:解析百度输入法词库文件,词库文件后缀为bdict
  • Sogou:解析搜狗输入法词库文件,词库文件后缀为scel
  • QQ:解析QQ输入法词库文件,词库文件后缀为qpyd

每个文件夹下都有两个文件,其中*2Txt.java调用了另外一个文件的类的功能,建议直接调用*2Txt.java文件即可,其功能是是将输入的词库源文件转为输出的txt文件,调用时需要处理抛出的异常。