Chinese_Polyphone_Disambiguation
Chinese_Polyphone_Disambiguation copied to clipboard
关于Embedding的问题
你好,看了里面的实现,你是将汉字_pos的特征作为整体进行embedding,和论文中将汉字、词性、是否多音字三种特征分别embedding后再concate的方法不同,有比较过之间的差异么?
抱歉啊,这么晚 才恢复你。 要不是在群里有人提到了 我都不记得我有这个仓库了
你说的这个方法,当时由于各种原因没有尝试过
现在既然提起来了,我就抽空再重新写吧 不过我准备用TF写了。。
我用自己数据做感觉效果很一般,无论怎么改有些多音字的发音准确率还是只有60,70%,
你是指 一些特定的多音字准确吧? 我没有这么衡量 我大概只选取了 80 个左右高频的多音字来训练模型 测试的时候衡量也是挑选了10%的数据来做的