HadoopDedup
HadoopDedup copied to clipboard
:watermelon:基于Hadoop和HBase的大规模海量数据去重
基于Hadoop和HBase的大规模海量数据去重
目录
data - 数据集
docs - 文档
src - MapReduce
环境
Hadoop版本1.1.2
HBase 0.94.8