SG-XM
SG-XM
想做小样本学习100样本左右,微调 tacotron 的 decoder 部分 #507 想知道fmax8000的话会对语音的相似度有什么影响吗,另外输出的这个 attention 图代表什么呢,横轴是步数,纵轴是attention,比如下面的这些输出该怎么分析呢,横轴代表步数的话为什么不是递增呢,这个图该怎么看呀 万分感谢!!希望可以深入交流     
样本数量大概在100条左右,冻结了tacotron的前面的参数,0.3step的速度合理吗,应该大概在什么数量级呀,以及 loss大概在什么数量级的时候效果会比较好呢
我如果有其他形式的数据集想用来做 ssl, 以及自定义 pretext task, 要如何适配数据集(比如最经典的IRIS)? 还是说现在的代码设计架构完全不支持其它类型的数据集呢? 感谢您的回答,祝工作顺利,身体健康!
For this case: I use CropWidget opening an image with fixed croparea, and drag imge , scale image, then i need to save the transformer of image. Because I need...
I want to crop one Image into several part. so I have some code below: ``` dart List resTask = []; for (int i = 0; i < param.type; i++)...
### Describe your problem "I have a very complex graph model, and in one of the processes, I connect an answer generation component with a human-computer interaction component. In this...
  VNN_Apply_Face_CPU 函数报错,在SourceImage create中我跟踪进入,发现图片原始channel count确实是3,不是4,但是这是否会对VNN造成影响?因为我不太熟悉VNN,实在无法解决这个问题。 我尝试过用同名png替换项目内的sample_face.png文件仍然存在问题。 我使用在线工具对项目内的sample_face.png进行裁剪,放回项目内依旧没有问题,故而排除了像素问题。 但我不知道下一步该怎么办,我尝试修改stbi_load让他强制加载4通道,但是似乎没有用,而且还会影响GL纹理绑定。