赞
踩
今天在学习爬虫,爬取豆瓣电影的一些json资料存到本地的时候遇到了一些问题,先解释一下:
在豆瓣手机版的“正在热映”页面里可以找到一些包,里面有当前页的内容(json格式):
所以requests模块可以去爬这些下来:
找到url,然后找到提交规律url里是用的start来表示当前页面显示的是哪些片。
还可以找到数据都放在subject_collection_items下面: