Erutan-pku

Results 2 issues of Erutan-pku

安利下NLPCC KBQA和DBQA评测的数据集,可以考虑用我之前做AAAI19的清洗预处理后的版本,是matching 任务,大概10K量级的问题,对应到matching pair大概100K量级。 我预处理后的数据见: https://github.com/Erutan-pku/LCN-for-Chinese-QA/blob/master/data_prepare.sh

想问一下这些问题和回答主要是要收集给怎样人的看的呢? 感觉目前看起来比较偏科普,比较时候刚入门的学生、准备水面试的求职者和拿来应付不懂事的老板的职员?所以如果想编辑的话应该不要写得太过学术而应该更通俗一点? 以及问题的收集标准是怎样的呀?一些知乎上的问答在征集到作者同意之后是否可以合并进来呢?比如下面这条: https://www.zhihu.com/question/49461559/answer/116241223 从问题和回答的形式和内容上是否合适? 以及顺便吐槽一下,虽然nlp看起来没什么人编辑吧~但凭什么CV就可以每个大的task分一章~😒