我想找到/获取世界上所有instagram影响者的用户名,他们拥有超过1万名粉丝。我有一个想法,我们可以在instagram上搜索一个标签,然后检索所有发布到这个标签上的用户名。然后,对于每个唯一的用户名,我们将检查他们是否有超过10k的追随者。任何达到目标的建议请。。。
wfypjpf41#
您可以使用 selenium , BeautifulSoup , request 或者你可以直接使用他们的API来完成你的工作。我不打算讨论API部分,您可以从他们的官方文档中找到/获得API方面的帮助。那我们就去刮吧。先用 selenium 登录并搜索 hashtag . 现在你得到了测试的结果 hashtag 搜索你可以刮 user ids 使用 BeautifulSoup ,你有 user ids 此外,你还可以做主要的网页抓取的事情,进入每个用户的档案,并检查是否有 followers 更多的是 10,000 或者不,然后保存或做你需要的事情,如果 followers 那就更多了 10,000 或者,如果没有,则刮取另一个用户配置文件。我不会写任何代码,你自己做研究,自己写代码。我将分享一些可能帮助你们解决问题的链接。在本文中,您可以使用 selenium 并获取用户标签。现在你必须使用 requests 及 BeautifulSoup 为了让追随者计数。这可能会帮助你解决这个问题。如果在浏览用户配置文件时发现超速问题,可以使用 threading 及 multiprocessing 为此。但首先要做所有其他步骤,只做线程和其他步骤,因为为webscraping编写代码有点棘手,而且做线程比webscraping容易得多。我已经回答了你的想法,我想找到/获取世界上拥有超过1万粉丝的所有instagram影响者的用户名但是做这件事非常困难,你可以想象,可能有成千上万的用户 10,000 追随者,这就是你想要找到的 1M+ 追随者的用户名那也是很难的事情。你可以从一些有instagram顶级粉丝名单的网站上抓取。这将使你的任务更容易。如果这有助于解决您的问题,请不要忘记将其标记为答案。
selenium
BeautifulSoup
request
hashtag
user ids
followers
10,000
requests
threading
multiprocessing
1M+
1条答案
按热度按时间wfypjpf41#
您可以使用
selenium
,BeautifulSoup
,request
或者你可以直接使用他们的API来完成你的工作。我不打算讨论API部分,您可以从他们的官方文档中找到/获得API方面的帮助。那我们就去刮吧。先用
selenium
登录并搜索hashtag
. 现在你得到了测试的结果hashtag
搜索你可以刮user ids
使用BeautifulSoup
,你有user ids
此外,你还可以做主要的网页抓取的事情,进入每个用户的档案,并检查是否有followers
更多的是10,000
或者不,然后保存或做你需要的事情,如果followers
那就更多了10,000
或者,如果没有,则刮取另一个用户配置文件。我不会写任何代码,你自己做研究,自己写代码。我将分享一些可能帮助你们解决问题的链接。在本文中,您可以使用
selenium
并获取用户标签。现在你必须使用requests
及BeautifulSoup
为了让追随者计数。这可能会帮助你解决这个问题。如果在浏览用户配置文件时发现超速问题,可以使用threading
及multiprocessing
为此。但首先要做所有其他步骤,只做线程和其他步骤,因为为webscraping编写代码有点棘手,而且做线程比webscraping容易得多。我已经回答了你的想法,
我想找到/获取世界上拥有超过1万粉丝的所有instagram影响者的用户名
但是做这件事非常困难,你可以想象,可能有成千上万的用户
10,000
追随者,这就是你想要找到的1M+
追随者的用户名那也是很难的事情。你可以从一些有instagram顶级粉丝名单的网站上抓取。这将使你的任务更容易。如果这有助于解决您的问题,请不要忘记将其标记为答案。