赞
踩
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。
PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取
《庆余年》在微博上一直霸占热搜榜,去微博看一下大家都在讨论啥:
一条条看显然不符合数据分析师身份
于是爬取了微博超话页面,然后找到相关人员,分别去爬取相关人员的微博评论,看看大家都在讨论啥。
import argparse parser = argparse.ArgumentParser(description="weibo comments spider") parser.add_argument('-u', dest='username', help='weibo username', default='') #输入你的用户名 parser.add_argument('-p', dest='password', help='weibo password', default='') #输入你的微博密码 parser.add_argument('-m', dest='max_page', help='max number of comment pages to crawl(number<int> larger than 0 or all)', default=) #设定你需要爬取的评论页数 parser.add_argument('-l', dest='link', help='weibo comment link', default='') #输入你需要爬取的微博链接 parser.add_argument('-t', dest='url_type', help='weibo comment link type(pc or phone)', default='pc') args = parser.parse_args() wb = weibo() username = args.username password = args.password try: max_page = int(float(args.max_page)) except: pass url = args.link url_type = args.url_type if not username or not password or not max_page or not url or not url_type: raise ValueError('argument error') wb.login(username, password) wb.getComments(url, url_type, max_page)
爬取到微博评论后,老规矩,词云展示一下,不同主角的评论内容差别还是挺大的
张若昀:
李沁:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。