赞
踩
1.环境须知
做这个爬取的时候需要安装好python3.6和selenium、pyquery等等一些比较常用的爬取和解析库,还需要安装MongoDB这个分布式数据库。
2.直接上代码
spider.py
import re
from config import *
import pymongo
from selenium import webdriver
from selenium.common.exceptions import TimeoutException
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from pyquery import PyQuery as pq
#mongodb配置信息
client = pymongo.MongoClient(MONGO_URL)
db = client[MONGO_DB]
#打开chrome浏览器
browser = webdriver.Chrome()
wait = WebDriverWait(browser, 10)
#第一次搜索页面的方法
def search
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。