baidu_ultr_dataset icon indicating copy to clipboard operation
baidu_ultr_dataset copied to clipboard

关于' Displayed Count'特征的疑问

Open gluver opened this issue 2 years ago • 1 comments

在数据探索过程中发现训练集合中对于文档存在两个命名相同的特征列' Displayed Count', 在数据集合的网页的列名解释中也发现了'Displayed Count'这一特征出现了两次,实际检查特征对应的值时确发现这两列的数值并不完全一致,请问是什么造成了这样的现象呢,或者说应该以哪一列的数值为准. 以下是part-00001.gz 的结果展示 image

gluver avatar Dec 18 '22 22:12 gluver

以左边数值较大的为准。

zoulixin93 avatar Dec 19 '22 02:12 zoulixin93