Ailln

Results 10 comments of Ailln

已经适配了 `四千五` 这样的口语表示,对于 `六千九百七` 这样的还是第一次碰到,因为它在口语中也不常见。

我觉得可以考虑把它们分一下类,比如: 1. class 1 - 十万八万 - 十万二十万 - 五千一万 2. class 2 - 万儿八千 - 千儿八百 3. class3 - 百十来万 - 十来万 4. class4 - 一二十万 - 三五百万 -...

能帮到大家我也很开心~ 你说的这个现象确实存在,目前只是做了简单的规则,这样的问题很难处理。 后续功能中我会想办法处理它,如果你有好的想法,欢迎 PR。

目前我想到的方法有: 1. 分词。这是一种比较简单的方法,但经过测试,分词有时很难把数字分对。 2. NER。这种方法比较复杂,有可能要引入类似于 Torch 这样的 600 MB 左右的框架(太大可能会对用户安装造成困难),而且这种方法我还没找到合适的公开数据集...

其他模块还在开发中……

我会在有空的时候更新,目前还不是一个完整成熟的项目。

#47 你先参考一下这个,近期会修复这个问题。

`v0.5.19` 已修复,请升级后再次尝试。

`v0.5.19` 已修复,请升级后再次尝试。