当前位置:   article > 正文

爬虫练习:Selenium使用案例

爬虫练习:Selenium使用案例

一、获取某电商平台商品信息

  1. from selenium import webdriver
  2. from selenium.webdriver.common.by import By
  3. import time
  4. import csv
  5. with open('苏宁商品.csv',mode='a',newline='',encoding='utf-8') as f:
  6. csv_writer = csv.writer(f)
  7. csv_writer.writerow(['title','price','comment','shop_name','href'])
  8. #打开谷歌浏览器
  9. driver = webdriver.Chrome()
  10. #打开网页
  11. driver.get('https://search.suning.com/%E7%A9%BA%E8%B0%83/')
  12. driver.implicitly_wait(5)
  13. #滚动
  14. driver.execute_script('document.querySelector("body > div.ng-footer > div.ng-s-footer").scrollIntoView()')
  15. time.sleep(1)
  16. driver.execute_script('document.querySelector("body > div.ng-footer > div.ng-s-footer").scrollIntoView()')
  17. #document.querySelector("body > div.ng-footer > div.ng-s-footer")
  18. time.sleep(1)
  19. #提取数据
  20. divs = driver.find_elements(By.CSS_SELECTOR,'.product-box')
  21. for div in divs:
  22. price = div.find_element(By.CSS_SELECTOR,'.price-box').text
  23. title = div.find_element(By.CSS_SELECTOR,'.title-selling-point').text
  24. comment = div.find_element(By.CSS_SELECTOR,'.info-evaluate').text
  25. shop_name = div.find_element(By.CSS_SELECTOR,'.store-stock').text
  26. href = div.find_element(By.CSS_SELECTOR,'.info-evaluate a').get_attribute('href')
  27. print(title,price,comment,shop_name,href)
  28. with open('苏宁商品.csv', mode='w', newline='', encoding='utf-8') as f:
  29. csv_writer = csv.writer(f)
  30. csv_writer.writerow([title,price,comment,shop_name,href])
  31. input()

二、获取某网站小说信息

  1. url ="https://www.00ksw.com/html/3/3804/"
  2. from selenium.webdriver import Chrome
  3. from selenium.webdriver.common.by import By
  4. driver = Chrome()
  5. driver.get(url)
  6. # print(driver.page_source)
  7. links = driver.find_elements(By.XPATH, "//div[@class='ml list']//ul//li//a")
  8. for link in links:
  9. print(link)

版权声明和免责声明

本博客提供的所有爬虫代码和相关内容(以下简称“内容”)仅供参考和学习之用。任何使用或依赖这些内容的风险均由使用者自行承担。我(博客所有者)不对因使用这些内容而产生的任何直接或间接损失承担责任。

严禁将本博客提供的爬虫代码用于任何违法、不道德或侵犯第三方权益的活动。使用者应当遵守所有适用的法律法规,包括但不限于数据保护法、隐私权法和知识产权法。

如果您选择使用本博客的爬虫代码,您应当确保您的使用行为符合所有相关法律法规,并且不会损害任何人的合法权益。在任何情况下,我(博客所有者)均不对您的行为负责。

如果您对本声明有任何疑问,或者需要进一步的澄清,请通过我的联系方式与我联系。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/羊村懒王/article/detail/582873
推荐阅读
相关标签
  

闽ICP备14008679号