LiZeng001

Results 4 comments of LiZeng001

请问为什么做预测时,输入图片像素不做归一化?就是class Predict(object)第24行: x = np.array([1 - flatten_img]) 为何不是 x = np.array([1 - flatten_img]) / 255.0 训练集做了归一化,预测时的输入数据不做也可以得到正确预测,这是为什么呢? 这两种操作有什么区别呢?

@Linf-p @geektutu 谢谢回复。 进一步做了些测试,这里是否归一化对最终结果(argmax)影响不大,但是明显影响各个分类的概率分布。尝试了 (/2, 4, 9, 16, 127, 200, 255)等归一化系数,影响softmax的分布。如:未归一化的预测结果为6,对应softmax向量第6个值的大小落在[0.6, 1.0]区间内。不做归一化时,一般为1.0, 归一化系数越大(→255.0),则softmax对应值越小,但是最终结果都是6. =============================================================== 目前觉得不明白的是这一步: x = np.array([1 - flatten_img]) 1-flatten_img是什么意思呢? 我用实际图片进行了测试,和用np生成的矩阵结果相差很大,具体如下: 图片大小(8,8,1),采用“img = Image.open(image_path).convert('L')”读入,并转为ndarray后为 [[249 249 249 249 248...

x = np.array([1 - flatten_img])建议改为 x = np.array([255 - flatten_img]) 灰度反转

> @LiZeng001 你好, > > 1. 因为是开放域抽取,所以输入必须包含schema以引导模型抽取相应结果。对于事件域未知的语料,一阶段的抽取目标可以用『触发词』代替,例如: > > ``` > {"触发词": ["时间", "赛事名称"]} > ``` > > 相比零样本直接调用,更推荐在场景相关的语料上标注少量数据进行微调定制 > > 2. 我们提供了UIE数据蒸馏的解决方案,可以将开放域抽取转为封闭域抽取,这样就不会有schema遍历的问题,具体可以参考这里的例子:https://github.com/PaddlePaddle/PaddleNLP/tree/develop/model_zoo/uie/data_distill 您好,谢谢回答。仍存在一些问题: 对于#1,如果语料事件域未知,则整个schema都未知,那对应的role列表也是未知的,所以示例中的["时间", "赛事名称"]也是无法给出的啊。 对于#2,建议的思路是转化为封闭域,对于数据的要求是同域同分布。而实际的情况是,所有语料可能涉及N个不同的事件域,但是每条语料具体属于哪个域未知,因此无法转为封闭域抽取。除了[LIC2021事件抽取任务基线](https://aistudio.baidu.com/aistudio/projectdetail/1639964 )中给出的枚举分类的思路(需要增加一级pipiline),有没有什么方法可以获得语料的事件域呢?这样就可以映射到预定义好的schema了。