Tony Chen

Results 15 comments of Tony Chen

> Loss正常下降,所有的看起来都很正常,就是用模型测试图片的时候没有框显示,这是什么原因呢? dataloader这块感觉作者还没有写全,载入box的时候很多问题

> > > Loss正常下降,所有的看起来都很正常,就是用模型测试图片的时候没有框显示,这是什么原因呢? > > > > > > dataloader这块感觉作者还没有写全,载入box的时候很多问题 > > 一般来讲是没有目标信息…你可以直接提出对应的问题,我核查后存在会修改的 按照正常voc格式输入后 dataloader载入的box格式不对,目前拿到的box都是[] 现在dataloader载入的是自己组建的imageset txt格式。 并且现在的dataloader里面数据增强 没有对box进行一起变换

谢谢!! 我建议在voc_annotation.py中直接生成目标信息

> ``` > #---------------------------------# > # 对真实框进行调整 > #---------------------------------# > if len(box)>0: > np.random.shuffle(box) > box[:, [0,2]] = box[:, [0,2]]*nw/iw + dx > box[:, [1,3]] = box[:, [1,3]]*nh/ih + dy...

> 1、有生成啊。 2、if flip: box[:, [0,2]] = w - box[:, [2,0]] 看到了 谢谢 我之前选的模式一直是1

> after i trained the model ,the loss is very low ,but when i evaluate on the train and test dataset all the scores are very very low and the...

> 感谢您的关注! 我们目前的奖励模型训练暂时只release了基础的训练方法。因为PART II中涉及的方法较多,同时我们也尝试了很多的组合,所以难以第一时间开源所有方法。负责相关实验的同学会在后续陆续更新到仓库。我们所有的方法均基于这套代码进行迭代。 我想请教一下margin的这个具体应该怎么确定数值?还有margin的范围有考究吗?

收到 十分感谢!还有个问题哈,目前我训练过的reward model对于短回答(1-10个token左右)的打分效果非常不好,这块你们遇到过类似情况吗?

回答长短都有。短的集中在一些确定性任务上,例如实体识别,语义分类这样的任务,一般回答例如:“积极”,“好”,“悲观”等极短的token。然后训练rm模型得时候,就会发现,在这些短回答的任务上,rm即使训练,(训练集&验证集)表现也都不佳。