zlh
zlh
> According to my understanding, `num_route_nodes` should be the length of the vote vectors that are used as input to dynamic routing. > > In the example code, this value...
I also encountered the same problem. Did you solve it?
我只在WebNLG上进行了实验,F1确实一直接近于0。似乎是因为输出矩阵过于稀疏而引起的这个问题。
> 是从第一个epoch就存在问题么? 对。从头到尾一直都是。我训练到第70轮,F1只有0.13
> > 是从第一个epoch就存在问题么? > > 对。从头到尾一直都是。我训练到第70轮,F1只有0.13 我没有修改任何代码。
好的。谢谢啦! ------------------ 原始邮件 ------------------ 发件人: "chenshaowei57"
+1.我也有同样的问题。
我明天再理解一下,谢谢热心解答! ------------------ 原始邮件 ------------------ 发件人: "chenshaowei57"
> 对于第一个问题,我们也尝试过sigmoid,但是效果不是很好,我们认为这可能是因为关系矩阵里1过于稀疏。考虑到文本中某个实体在特定的关系类别下仅会与少量的词存在关联关系,因此我们采用softmax来对于预测的稀疏性进行某种程度的约束。 > 对于第二个问题,我们确实没有在计算损失的时候利用all_input_mask,但是我们在计算语义的过程中将mask的词的语义置为0,因此对于性能没有明显影响。 > 对于第三个问题,这是我们采用的一种策略,主要为了保证计算的概率属于0-1区间,进而更合理地设置阈值。 您好, 关于问题1,程序在数据生成部分的"all_relations"张量里,是按照sigmoid的标准来生成target的,比如说“(中国,首都,北京)”这个三元组对应的"all_relations"张量里面“(中,北),(中,京),(国,北),(国,京)”这四个元素全部设置成为了1。 很明显模型用softmax函数不能拟合这个矩阵的,请问您是怎么看待这个问题的?
> 你如果实在找不到的话 再跟我说吧~ 给我个邮箱 发给你。 谢谢你了。[email protected]。找是可以找到,但是不清楚数据的格式是什么样子,没有做过相关的任务