Results 1 comments of Hontsev

data_format是在训练/测试之前对数据读入和规范化处理用的,具体来说是把句子分词、词性标注(用jieba),做成crf可以读入的格式。有一些涉及训练数据的函数,是为了把那种用花括号标记实体的语料转化为每一行一个字和一个位置标记的格式。 合并的话暂时还没做这个功能。。