Tieba_Spider
Tieba_Spider copied to clipboard
添加cookie
账号某些帖子或楼层被百度限制,只有登录相应账号才能看到内容,因此会有带cookie爬取的需求。cookie形式类似:
timeShow=
BAIDUID=
TIEBA_USERTYPE=
TIEBAUID=
pgv_pvi=
bdshare_firstime=
BAIDU_WISE_UID=
IS_NEW_USER=
SEENKW=
BDUSS=
BDUSS_BFESS=
BDORZ=
STOKEN=
Hm_lvt_xxx=
wise_device=
Hm_lpvt_xxx=
st_data=
st_key_id=
st_sign=
其中重要的估计就BDUSS或者STOKEN。但我把cookie所有内容直接复制到未登录的浏览器里,似乎还是没法看到内容(还是未登录状态)。
若有成功的朋友,望指教。
@shitianshiwa 请问下你的项目里cookie是怎么设定的?
推测分析一下浏览器指纹、浏览器版本等内容。盲猜。
研究github有什么功能时才看到。。。。没有添加cookie(直接填空字符串),所以爬不了隐藏贴。
我将cookies拷到未登陆的浏览器中,可以实现登陆,到拷到程序中去模拟请求却无法绕过验证码