smart_login
smart_login copied to clipboard
淘宝滑块登陆
我用selenium模拟浏览器 进行滑块登陆,滑块用了随机抖动和随机移动进行,添加了user-agent ,但是还是被判断为机器,而无法通过,之后手动通过验证后,突然只要用selenium打开网址,手动验证都无法通过了。不知道是不是淘宝识别出来了
由于常用浏览器的webdriver都有明显的指纹特征,以前我在做一个测试项目遇到过。它的保护系统会直接根据webdriver的特征来判断你是人为还是自动化工具做的,当时的解决方式是,1.逆向了对方的保护系统的js,2.采用了新型的webdriver做自动化操作。根据你的描述,淘宝好像也用了这种技术,另外还结合了其他技术。
我现在的解决方案是换用了firefox的webdriver进行操作,但是在滑块那一块还是得手动去完成,对于这个滑块问题,想请教一下,您这边有没有其他的建议,比如从什么方面去模拟破解,能够提供一个思路~ 谢谢啦
具体要逆向的话,只有在前端页面打断点再调试,可能前端核心代码被混淆了,需要用如etacsufbo之类的反混淆工具来协助。
使用firefox的也不行,手动拖也不行。。。
selenium的很多特征能够被反爬识别,比如window.navigator.webdriver = true,这样的话你无论怎么操作都会被当成爬虫。所以要改变这些属性值。
@liuqinh2s 谢谢大佬回复!请问下大佬,目前淘宝图片爬虫,是可行的吗?请问下可以模拟鼠标点击桌面那种方式去爬取吗?
我试着使用使用 Python + Selenium 破解滑块验证码 - aneasystone's blog中所提到的
easing
来模拟‘真实人类的拖动’,但是不能够生效,滑块一下子就被拖过去了,并不是一个‘先快后慢’的过程。之后我自己手动去拖动滑块,还是不行,是不是因为淘宝已经断定了那个浏览器就是“机器人”,而不是“死的机器”?所以不管背后操作它的人是机器人它自己,还是真实的人类,淘宝都不会响应。
相关的issue:淘宝滑动验证 · Issue #76 · Kr1s77/awesome-python-login-model 相关的pull request:增加"淘宝用户名密码方式登录" & taobao.py -> taobao_via_weibo.py by JasonJunJun · Pull Request #86 · Kr1s77/awesome-python-login-model