苏剑林(Jianlin Su)
苏剑林(Jianlin Su)
内部自动生成。
那是你没有通读capsule整个流程和思想。 capsule就是希望向量的模长为0~1之间,代表着激活程度(概率值),所以用向量的模长(也就是`K.sqrt(K.sum(K.square(x), 2))`)是最自然的
防止抽取出的实体包含非法字符。
请教简洁写法
如果你的评价指标是spearman相关系数,那么它只依赖于预测结果的相对顺序,跟范围无关,比如将每个预测结果从y改为y**3+10,spearman相关系数不会变化; 如果你的评价指标是pearson相关系数,那么它只依赖于预测结果的线性关系,跟范围无关,也就是说如果将每个预测结果做同一个线性变换(比如3y+1),pearson相关系数不会变化; 如果你非要一个[1,5]之间的指标,那也很容易,比如(3 + 2 * cos)就能保证在1~5之间。
> 谢谢解答,如果是分类任务,如何评价向量的质量呢,比如两句话的关系是包含,无关,对立这种数据集,看STS也有这样的label 分类任务直接算acc呀
哦,你说直接用NLI语料来评价无监督句向量?NLI数据本身就不是严格的相似度数据,这也不大好评价吧。 比较简单的方法是将包含、无关、对立分别转化为得分1、0、-1,然后算spearman,可能会有一定的效果。比较靠谱的方式是用句向量作为输入特征,训练一个3分类模型,然后比较acc。
将句向量进行降维的操作,我确实没留意到其他的。
可以发一下完整的错误信息吗?我需要知道在bert4keras的哪一行出现错误。
这是个keras问题,不是bert4keras问题。 原则上来说,bert4keras只帮你搭好keras下的bert模型,剩下一切不管,你用bert4keras的舒适程度,取决于你对keras的熟悉程度,而这里不负责keras培训。