Ian
Ian
说这个月底会出一个新版本,能提升效率的。计划没有变吧?
在examples/faiss_example中的rocketqa_service.py是个单进程处理的demo,无法适应同时处理多个请求。我将其改为多进程多线程的处理方式,响应就会出现错误,查看错误信息,发现就是调用: q_embs = self._dual_encoder.encode_query(query=[query]) File "/home/eyundl/anaconda3/envs/paddle_env/lib/python3.7/site-packages/rocketqa/predict/dual_encoder.py", line 145, in encode_query fetch_list=fetch_list) File "/home/eyundl/anaconda3/envs/paddle_env/lib/python3.7/site-packages/paddle/fluid/executor.py", line 1299, in run six.reraise(*sys.exc_info()) File "/home/eyundl/anaconda3/envs/paddle_env/lib/python3.7/site-packages/six.py", line 719, in reraise raise value File "/home/eyundl/anaconda3/envs/paddle_env/lib/python3.7/site-packages/paddle/fluid/executor.py", line 1295,...
RocketQA
Thanks for your issue. To help us solve the issue better, please provide following information: 1. PaddleNLP version: (please specify the branch as well,e.g. PaddleNLP v2.2.1) 2. PaddlePaddle version: (e.g....
首先我录制了三段语音做为模版文件: zhao1.wav:说的是一句简短的中文; zhao2.wav:说的是0-9的数字; zhao3.wav:说的是另一句不同的中文; 然后我按照模版文件内容再生成三个录音: file1.wav和zhao1.wav,file2.wav和zhao2.wav,file3.wav和zhao3.wav的内容分别相同。 然后两两做score,得出的结果是: zhao1.wav(file1.wav):0.7422892451286316;zhao1.wav(filé.wav):0.6398638486862183;zhao1(file3.wav):0.6861986517906189 zhao2.wav(file1.wav):0.43911170959472656;zhao2.wav(filé.wav):0.7633090019226074;zhao2(file3.wav):0.4422371983528137 zhao3.wav(file1.wav):0.6625332236289978;zhao3.wav(filé.wav):0.6106154322624207;zhao3(file3.wav):0.7869642972946167 可以看到zhao1.wav(file1.wav),zhao2.wav(filé.wav),zhao3(file3.wav)得分最高。 这如何解释呢?
说明: 1、我们分别采样了7个人的声音,每个人采样三段声音。将这些声音做为基础声音模版库; 2、第一句:说的是一句简短的中文;第二句:说的是0-9的数字;第三句:说的是另一句不同的中文; 3、然后将这21个声音分别从中找到最相似的声纹; 4、实际验证结果是非常不理想,请帮忙指出我们流程哪里出错了,以及如何进行改进。我们是真的希望能够将其应用到实际业务场景中。 5、总共21次比对,准确找到的:15;找错人的:6;准确率只有71%。 明细结果:每个语音声纹最相似的语音,以及score。(score 的计算方法:paddlespeech vector --task score --input ' ') zhao1.wav ---------------- 1 zhao3.wav 0.7540673613548279 zhao2.wav ---------------- 1 zhao1.wav 0.657843291759491 zhao3.wav ---------------- 1 zhao1.wav 0.7540673613548279 liu1.wav...
1、我生成了三个录音:tellong.wav作为原始录制的模版声音;teloriginal.wav是测试由真人说话生成的录音;recording.wav是播放真人录音形成的录音(模拟使用录音冒充他人声音); 2、我使用命令“paddlespeech vector --task score --input 'recording.wav tellong.wav'”,计算冒充人和模版声音的相似度,得到:0.5637418627738953; 3、我使用命令“paddlespeech vector --task score --input 'teloriginal.wav tellong.wav'“,计算真人说话和模版声音的相似度,得到: 0.5126219987869263 4、使用录音的相似度反而更高。这样对于系统就无法识别伪装者了。 请教这个过程有什么问题吗?