youzilai
youzilai
我也是做类似的,跑3000fps,也看了这个sdm,想用上一帧的boudingbox来做检测。看sdm代码时,第一帧检测用的是检测器检测后变换的框,接下来的跟踪使用的是最小外接矩形,竟然检测效果很好。于是我换成全部用人脸检测器变化后的框来做检测,效果不好了。考虑到这种情况,想知道在训练时所用的boudingbox是怎么算的,用的哪种...正在读代码..
我qq1215764141,方便的话交流哈
你也在做这块呢?我也正在弄,做的不好,想用光流法,对于眼睛和嘴巴的形变无力。考虑到它们的形变方向在两眼连线的法线方向上,所以想修改光流法在计算其中一个运动分量时的部分,但是还没弄出来。另外我试了转换颜色空间,小波纹理都不理想.. 随机扰动的效果的确好像好了些..前段时间加上了,最近木有看了..跟踪人眼人嘴这块思路不好,作者可以提个思路不..谢谢啦..
你弄好没,我也是找不到...看了编写规则,反推不出来...
刚刚弄好了,写代码,弄个xml文件,如下格式就好了,书名号改成单个尖括号 《image》 p=D:\sources\imageCollection\300w\300W\01_Indoor/indoor_001.png part index=0 x=446 y=91 part index=1 x=449.459 y=119.344 part index=2 x=450.957 y=150.614 ...... part index=66 x=557.473 y=240.542 part index=67 x=547.989 y=240.014 《box》 x=446 y=91 w=202 h=181 《image》...
从b站来的哈哈哈
> 我将代码修改成这样的了:context_length = len(a_ids) 我后来改成了 context_length = input_ids.index(tokenizer._convert_token_to_id("sop")),能通过了,但是在model_engine, optimizer, _, _ = deepspeed.initialize(config=conf, model=model, model_parameters=model.parameters()) 时 又遇到了torch.cat tensor为空的情况..有没有相似的呢
> 同问,为什么没有bos_token_id。另外eos_token_id和pad_token_id为啥相等,都是2? 有bos_id,不过没发现对应的special token,我把代码改成下面了 tokens = prompt_tokens + src_tokens + ["[gMASK]", "sop"] + tgt_tokens + ["eop"] input_ids = tokenizer.convert_tokens_to_ids(tokens) context_length = input_ids.index(tokenizer._convert_token_to_id("sop"))
thank you for your reply, and i just scan your advice MDM, and found this propgram is also used 300W dataset, umm..do you know some datasets include closed eye, after...
well,thank you for your advice, and these days, i have trained intraface method and facealignment(https://github.com/1adrianb/face-alignment),and also dlib, indeed ,no one have a good performance for every case, i need to...