Python爬虫+数据分析+可视化展示,分析《长津湖之水门桥》弹幕评论

x33g5p2x  于2022-02-21 转载在 Python  
字(1.2k)|赞(0)|评价(0)|浏览(568)

吴京近年拍的影视都是非常富有国家情怀的,大人小孩都爱看,每次都是票房新高,最新的长津湖两部曲大家都有看吗,第一步还可以,第二部水门桥也不差,截止目前已经36.72亿票房。

某眼评分9.6,某瓣评分7.2。2月每日票房基本每天第一,但是它为什么好看呢?让我们用python来看看,看过的人都在说什么~

一、准备工作

爬虫部分需要使用这几个模块

  1. requests
  2. parsel
  3. csv

前面两个需要安装,键盘上按 win+r 打开运行框,输入 cmd 然后确定,然后输入 pip install 模块名,回车即可安装。

详情看我置顶文章

二、代码

代码仅供参考,我就不一一分析,录了一个十分钟的视频讲解,不会的兄弟可以跟着视频学习。

【Python案例合集】十分钟速成一个,就是这么效率!更多案例持续更新...

这也是一个视频合集,正在慢慢更新,大家可以三连一下~

代码

  1. import csv
  2. import requests
  3. import parsel
  4. headers = {
  5. 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.102 Safari/537.36'
  6. }
  7. for page in range(1, 20):
  8. url = f'...../subject/35613853/comments?start={page*20}&limit=20&status=P&sort=new_score'
  9. data_html = requests.get(url=url, headers=headers).text
  10. selector = parsel.Selector(data_html)
  11. comment_list = selector.css('.comment-item')
  12. for comment in comment_list:
  13. short = comment.css('.short::text').get().strip()
  14. name = comment.css('.comment-info a::text').get().strip()
  15. time = comment.css('.comment-time::text').get().strip()
  16. vote_count = comment.css('.votes.vote-count::text').get().strip()
  17. print(short, name, time, vote_count)
  18. with open('长津湖.csv', mode='a', encoding='utf-8', newline='') as f:
  19. csv_writer = csv.writer(f)
  20. csv_writer.writerow([short, name, time, vote_count])

词云图和数据分析的,今晚有超详细讲解,在我主页左侧观看方法

兄弟们快去试试吧,有什么问题欢迎三连后在评论区交流~

相关文章