python 避免使用Selenium的reCAPTCHA

k4ymrczo  于 2022-11-21  发布在  Python
关注(0)|答案(2)|浏览(198)

我试着用 selenium (chromedriver)进行网页抓取,但始终获取reCaptchas(连续5-8个左右)这是我必须解决的。当我用谷歌Chrome手动访问同一网站时,我甚至没有得到一个验证码。我不使用无头选项...有什么解决方案,以避免这些验证码?或获得最多1-2个验证码为一个请求?我是认真的。It“对我来说解决验证码不是问题,但是连续5-8个需要很多时间。

6fe3ivhb

6fe3ivhb1#

有一些像2captcha这样的验证码解决器,每个验证码大约需要15-40秒。验证码是用来检测各种形状和形式的机器人的,嗯......这就是它所做的。简单的答案是:不,没有“旁路”
有一些变通方法可以避免整个系统,比如使用alt-login,比如一个可能使用不同API的应用程序。这可以通过appium(类似于selenium)或HTTPRequest库来实现。

eit6fx6z

eit6fx6z2#

我遇到了同样的问题。在网上有很多曾经起作用的提示,就像评论中使用特定标题的建议一样,尤其是显式设置用户代理或减慢页面上的操作(如点击)来模拟真实的用户操作。我发现他们都不工作,目前与最新的reCaptcha版本和回落到使用非无头模式和手动解决captcha之前,我的一旦我通过了验证码,脚本就会接管并发挥它的魔力。

相关问题