SenseVoice icon indicating copy to clipboard operation
SenseVoice copied to clipboard

【请教】数据集的各个字段解释

Open LateLinux opened this issue 1 year ago • 1 comments

Notice: In order to resolve issues more efficiently, please raise issue following the template. (注意:为了更加高效率解决您遇到的问题,请按照模板提问,补充细节)

❓ Questions and Help

计划标注部分数据,但不是很明白各个字段的含义,特请教。

  • 已基本搞明白的有:

"key"、"source"、"target"、"target_len"、“text_language”、“emo_target”

  • 不太明白的有:

"source_len",issue里有解释是“帧”,对应“10ms”,但个别已有数据集中也对不上,所以对“有效音频信息”的理解也许有偏差,求解释。

  • 完全没有找到信息的有:

“event_target”、“with_or_wo_itn”

感谢感谢!

LateLinux avatar Sep 13 '24 08:09 LateLinux