LebudiPrince
Results
2
comments of
LebudiPrince
MIDI转mp3的时候有个tempo参数,tempo在视频的metadata.json里
> > 请问这部分的代码在哪里呢?貌似没有找到InternVL-Flash > > 会尽快开源的,目前还在整理代码 请问在3.5论文中Visual Consistency Learning的部分,I_ξ是表示一张图所有patch都统一压缩为1/4或1/16吗。另外,在ri的计算公式中,i似乎表示的是patch的index,但损失函数L_ViCO中的i似乎表示token的index,这样的话ri的计算公式该如何理解呢。