UniCATS-CTX-txt2vec
UniCATS-CTX-txt2vec copied to clipboard
如何得到的Duration信息的?
SIL1和SIL2有什么区别?
Duration信息是通过Kaldi的forced alignment得到的,这步操作我们很早就做了,一时找不到最初的代码,见谅见谅;但是可以肯定的是用Kaldi得到phone序列后,它会自动插入optional silence,也就是SIL记号。随后我们按照不同SIL对应duration的长度进一步对其划分,具体而言应该是这样:
SIL1:dur <= 3 SIL2:3 < dur <= 5 SIL3: 5 < dur <= 9 SIL4: 10 < dur <= 15 SIL5: 16< dur <= 25 SIL6: dur > 25
当然事实上不一定需要这么多级别的silence标记,我们这里是沿用了之前的结果。