webmagic
webmagic copied to clipboard
在HashSetDuplicateRemover这个类里,如果先对url做一个md5的hash,再保存到hashset里去重,是不是能节省很多内存?
在HashSetDuplicateRemover这个类里,如果先对url做一个md5的hash,再保存到hashset里去重,是不是能节省很多内存?
可以考虑下
这=用时间换空间