hanzi_chaizi icon indicating copy to clipboard operation
hanzi_chaizi copied to clipboard

请问拼音和汉字,是以什么形式引入神经网络模型的呢?

Open dongrixinyu opened this issue 4 years ago • 3 comments

请问拼音和汉字,是以什么形式引入神经网络模型的呢? 例如已经得到了,“国”:guo2,以及 囗,如何将其转化为 向量表示呢?

dongrixinyu avatar Jun 30 '20 09:06 dongrixinyu

Hi 我的 https://github.com/howl-anderson/hanzi_char_featurizer 项目实现了特征到向量表示的接口,欢迎使用。

howl-anderson avatar Jun 30 '20 09:06 howl-anderson

Hi 我的 https://github.com/howl-anderson/hanzi_char_featurizer 项目实现了特征到向量表示的接口,欢迎使用。

只有 0-1编码这一种方式吗?

dongrixinyu avatar Jul 01 '20 05:07 dongrixinyu

是的 后续 你可以接一个 embedding 层,得到你想要的向量表示。

howl-anderson avatar Jul 01 '20 05:07 howl-anderson