weibo-search
weibo-search copied to clipboard
关于关键词爬取结果不够准确的问题
大佬您好,我爬取的结果有些问题,想请教一下您。我需要爬取的关键词是“虚拟人”,时间是2023全年,但是出现了大量不符合要求的结果,如:
“在最后一天收到了喜欢的日历!我是不做展望的类型,更罔论所信任的网上邻居做了时代的悲观预期在前,也就不做什么断论了。祝自己和其他人,明年过一种现实而非虚拟的生活,想见的人都能见到,微小的所愿都能达成,即使丧气也没有关系。”
"多年以后我也会想这一切是否是真实存在的人是虚拟的感情是真的新年快乐萧逸"
"我无数次试图在scoups、svt队长的身份下窥见普通人崔胜澈的一角这一部分忽近忽远也许你在不易察觉的时候展现过吧可是我不确定这些眼泪这些笑容是来自哪一个你爱豆呀一个又真实又虚拟的存在很难说我爱的是哪一个你但只要是你我就会爱着的新年快乐:)"
这种数据都是把“虚拟人”拆开,是由“虚拟”+“人”的结果。目前来看大量数据都是这样的,导致爬取效率较低,耗时也较高,请问有什么方式解决这个问题吗?