刘一为
刘一为
What configuration commands or configurations are used to train p7-1280 and p7-1920?
``` export NO_TCMALLOC="True" ``` Set this up and it's working fine for now
I also encountered a similar problem, for the recognition of single-line text, there will be such a situation of incomplete recognition. Using yolov8x-p6
> 当前的尝试涉及重新平衡班级比例。最初,细长物体仅占所有矩形的不到 20%。目前正在调整以制作约 80% 的所有类别的细长物体:**第二个模型的结果要好得多。请参阅下面的结果。** > >    I have also tried to train using only a long data set, but the final recognition results are similar to...
# testMNNFromOnnx.py的结果 Dir exist onnx/test.onnx inputVar.name:t shapes:[1, 17] tensor(int64) inputVar.name:language shapes:[1, 17] tensor(int64) inputVar.name:x shapes:[1, 17] tensor(int64) inputVar.name:sid shapes:[1] tensor(int64) inputVar.name:bert_0 shapes:[17, 1024] tensor(float) inputVar.name:bert_1 shapes:[17, 1024] tensor(float) inputVar.name:bert_2 shapes:[17,...
> 模型中有随机算子,结果是不能对齐的 这个有什么修改建议?
> 模型中有 random 算子,结果是不能对齐的 onnx模型推理出来的pcm是一段hello world语音,但mnn推理出来的并不能正常发音
``` bool save_audio_pcm(const std::vector &audio, const std::string &filePath) { std::ofstream file(filePath, std::ios::binary); if (!file.is_open()) { // 文件打开失败 return false; } for (float sample: audio) { if (sample > 1 ||...
> save_audio_pcm 的代码是? 或者完整可跑的工程可以发一下? 这里是否有后继的进展或还需要提供什么吗?
[code.zip](https://github.com/alibaba/MNN/files/15136977/code.zip) 这个是推理的代码,USE_MNN标记控制使用onnx还是mnn,调用入口方法 ``` auto mmm = sl_t2s::t2s_model_test(); mmm.init("onnx or mnn path"); mmm.exe_onnx("output pcm path"); ``` 最终输出结果pcm可使用python转成wav来播放 ``` import numpy as np import soundfile as sf pcm_data = np.fromfile('xxx.pcm', dtype=np.float32) sf.write('../out/xxx.wav',...