Chinese_Polyphone_Disambiguation icon indicating copy to clipboard operation
Chinese_Polyphone_Disambiguation copied to clipboard

关于Embedding的问题

Open JoeyHeisenberg opened this issue 5 years ago • 3 comments

你好,看了里面的实现,你是将汉字_pos的特征作为整体进行embedding,和论文中将汉字、词性、是否多音字三种特征分别embedding后再concate的方法不同,有比较过之间的差异么?

JoeyHeisenberg avatar Nov 08 '19 07:11 JoeyHeisenberg

抱歉啊,这么晚 才恢复你。 要不是在群里有人提到了 我都不记得我有这个仓库了

你说的这个方法,当时由于各种原因没有尝试过

现在既然提起来了,我就抽空再重新写吧 不过我准备用TF写了。。

MachineJeff avatar Dec 13 '19 14:12 MachineJeff

我用自己数据做感觉效果很一般,无论怎么改有些多音字的发音准确率还是只有60,70%,

JoeyHeisenberg avatar Dec 25 '19 03:12 JoeyHeisenberg

你是指 一些特定的多音字准确吧? 我没有这么衡量 我大概只选取了 80 个左右高频的多音字来训练模型 测试的时候衡量也是挑选了10%的数据来做的

MachineJeff avatar Dec 25 '19 03:12 MachineJeff