当前位置:   article > 正文

python3实现爬取淘宝页面的商品的数据信息(selenium+pyquery+mongodb)_python爬取淘宝商品信息

python爬取淘宝商品信息

1.环境须知
做这个爬取的时候需要安装好python3.6和selenium、pyquery等等一些比较常用的爬取和解析库,还需要安装MongoDB这个分布式数据库。
2.直接上代码
spider.py

import re
from config import *
import pymongo
from selenium import webdriver
from selenium.common.exceptions import TimeoutException
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from pyquery import PyQuery as pq
#mongodb配置信息
client = pymongo.MongoClient(MONGO_URL)
db = client[MONGO_DB]
#打开chrome浏览器
browser = webdriver.Chrome()
wait = WebDriverWait(browser, 10)
#第一次搜索页面的方法
def search
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/爱喝兽奶帝天荒/article/detail/970108
推荐阅读
相关标签
  

闽ICP备14008679号