如何避免instruct_text被读出来?
当instruct_text比较长的时候,有时候就会被读出来,多试几次发现也不是每次都读出来,非常难掌握 现在我的解决办法是尽量让instruct_text短一些,但也不知道具体要多短才能完全避免被读出来 https://github.com/FunAudioLLM/CosyVoice/issues/1120
请注意我说的不是那几个固定的 fine grained control
你好,请问固定的那几个情感指令有哪些,在哪里看知道吗
固定的fine grained control在cosyvoice/tokenizer/tokenizer.py
special_tokens = {
'eos_token': '<|endoftext|>',
'pad_token': '<|endoftext|>',
'additional_special_tokens': [
'<|im_start|>', '<|im_end|>', '<|endofprompt|>',
'[breath]', '<strong>', '</strong>', '[noise]',
'[laughter]', '[cough]', '[clucking]', '[accent]',
'[quick_breath]',
"<laughter>", "</laughter>",
"[hissing]", "[sigh]", "[vocalized-noise]",
"[lipsmack]", "[mn]"
]
}
固定的细粒度控制
cosyvoice/tokenizer/tokenizer.pyspecial_tokens = { 'eos_token': '<|endoftext|>', 'pad_token': '<|endoftext|>', 'additional_special_tokens': [ '<|im_start|>', '<|im_end|>', '<|endofprompt|>', '[breath]', '<strong>', '</strong>', '[noise]', '[laughter]', '[cough]', '[clucking]', '[accent]', '[quick_breath]', "<laughter>", "</laughter>", "[hissing]", "[sigh]", "[vocalized-noise]", "[lipsmack]", "[mn]" ] }
谢谢
This issue is stale because it has been open for 30 days with no activity.
请问哪里能获取训练时用到了哪些prefix单词?训练数据有哪些“方言”,“情感”,“速度”,“角色”相关的单词?我想生成时只用这些单词效果会好很多吧?
mark! 指令合成预训练模型,生成的内容具有有指令文本。