movenet.pytorch
movenet.pytorch copied to clipboard
关于regs译码会导致标签偏移的问题
请问下regs译码的时候,为何要给regs_origin+0.5再int32呢,我验证了一张图片,其编码时对于48*48而言,最后一个关键点的标签是H W =42 16,但译码以后变成了42 17,原因就在于cx cy是24 24,原regsx本来是-8,但+0.5再int32导致其出现偏移,即对于x<cx和y<cy的都会因此导致偏移, 请问这是有原因的还是错误
+0.5是考虑像素点的值对于网格化int化的数据应该是居中的,即0.5的位置。 主要还是像素点网格化的偏差。 比如图片尺寸为2x2,那么就是有四个像素值,左上角的像素值为1,应该对应的是左上网格的中心,而不是左上网格的左上角点。