python selenium 爬虫，使用代理，和 python 爬取代理网站，保存ip_selenium设置ip代理后但还是本地ip

作者：代码大牛 | 2024-01-29 20:47:08

踩

selenium设置ip代理后但还是本地ip

selenium 使用代理


import time
from selenium import webdriver
 
# 使用代理
options = webdriver.ChromeOptions()
 
options.add_argument("--proxy-server=http://101.37.79.125:3128")
driver = webdriver.Chrome(chrome_options=options)
driver.maximize_window()
 
driver.get('url')

python 爬取代理服务器保存本地（本人亲测，可用）


import requests
from bs4 import BeautifulSoup
import random
 
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.146 Safari/537.36'}
 
def xici_ip(page):
    for num_page in range(1,page+1):
        url_part = "http://www.xicidaili.com/wn/" # 爬取西刺代理的IP，此处选的是国内https
        url = url_part + str(num_page)  # 构建爬取的页面URL
        r = requests.get(url, headers=headers)
        if r.status_code == 200:
            soup = BeautifulSoup(r.text,'lxml')
            trs = soup.find_all('tr')
            for i in range(1,len(trs)):
                tr = trs[i]
                tds = tr.find_all('td')
                ip_item = tds[1].text + ':' + tds[2].text
                # print('抓取第'+ str(page) + '页第' + str(i) +'个：' + ip_item)
                with open(r'D:\ip.txt', 'a', encoding='utf-8') as f:
                    f.writelines(ip_item + '\n')
                # time.sleep(1)
            return ('存储成功')
 
def get_ip():
    with open(r'D:\ip.txt', 'r', encoding='utf-8') as f:
        lines = f.readlines()
        return random.choice(lines)
 
def check_ip():
    proxies = {'HTTPS': 'HTTPS://' + get_ip().replace('\n', '')}
    try:
        r = requests.get('http://httpbin.org/ip', headers=headers, proxies=proxies, timeout=10)
        if r.status_code == 200:
            return proxies
    except Exception as e:
        print(e)
 
def main():
    xici_ip(1)
    try:
        return check_ip()
    except Exception as e:
        print(e)
        check_ip()
 
if __name__ == '__main__':
    main()

声明：本文内容由网友自发贡献，转载请注明出处：【wpsshop】

推荐阅读

article
Python “贪吃蛇”游戏，在不断改进中学习pygame编程
文章浏览阅读1.5w次，点赞124次，收藏198次。Pygame是一个基于Python的游戏开发库，它提供了一系列的工具和接口，使开发人员能够轻松地创建各种类型的游戏，包括2D游戏和简单的3D游戏。Python“贪吃蛇”游戏，在不断改进中学... [详细]
赞
踩
article
FastAPI 库（Python 的 Web 框架）基本使用指南（二）
文章浏览阅读6.5k次，点赞46次，收藏39次。FastAPI库（Python的Web框架）基本使用指南（二）FastAPI库（Python的Web框架）基本使用指南（二）核心功能定义路由FastAPI中定义路由的方式主要有两种，一种是使用... [详细]
赞
踩
article
Python Get()函数用法介绍_python中get函数用法
文章浏览阅读3k次，点赞4次，收藏16次。Python是一种高级编程语言，它具有简单、易学、高效等特点。而Pythonget()函数是其中一个重要的函数。该函数用于返回指定键的值，如果键不存在，则返回默认值None。下面将从各个方面对Pyt... [详细]
赞
踩
article
【Python/网络安全】 Git漏洞之Githack工具基本安装及使用详析
文章浏览阅读1.1w次，点赞55次，收藏66次。本文仅分享Githack工具基本安装及使用相关知识不承担任何法律责任。Git是一个非常流行的开源分布式版本控制系统，它被广泛用于协同开发和代码管理。许多网站和应用程序都使用Git作为其代码管理... [详细]
赞
踩
article
Python----网络爬虫
文章浏览阅读6.9k次，点赞46次，收藏122次。get()是获取网页最常用的方式，在调用requests.get()函数后，返回的网页内容会保存为一个Response对象，其中，get()函数的参数url必须采用HTTP或HTTPS方式访... [详细]
赞
踩
article
Python：核心知识点整理大全11-笔记
文章浏览阅读1.5k次，点赞44次，收藏46次。6.2.4修改字典中的值要修改字典中的值，可依次指定字典名、用方括号括起的键以及与该键相关联的新值。我们首先定义了一个表示外星人alien_0的字典，其中只包含这个外星人的颜色。接下来，我们将... [详细]
赞
踩
article
Python web实战之Django的文件上传和处理详解_django上传
文章浏览阅读3.8k次。本文介绍了Django框架中文件上传和处理的基本原理和实现方法，以及阿里云oss的对接方法。Django提供了一些内置的功能和工具，使文件上传变得简单和安全。它提供了一个处理文件上传的高级API，可以验证上传的文件... [详细]
赞
踩
article
【Python】一文带你掌握数据容器之集合，字典
文章浏览阅读1k次，点赞80次，收藏72次。本文主要介绍了集合和字典相关的知识，其中集合最大的特点就是无序和无重复，有三个特殊的操作，取出差集，消除差集，集合合并；字典最大的特点就是每个数据都是KeyValue键值对，且Key不可重复【Py... [详细]
赞
踩
article
【Python 零基础入门】Pandas
文章浏览阅读4.4k次，点赞41次，收藏263次。深入探索Python的Pandas库：从核心数据结构到高级特性，本指南为你提供了全面的Pandas知识概览。无论你是数据初学者还是专家，都可在此找到宝贵的insights和技巧，助力你的数据... [详细]
赞
踩
article
【文末送书】Python OpenCV从入门到精通
文章浏览阅读2k次，点赞104次，收藏87次。OpenCV（OpenSourceComputerVisionLibrary）是一个开源的计算机视觉库，提供了丰富的图像处理和计算机视觉算法。它由一组用C++编写的函数和工具组成，同时也支持多种... [详细]
赞
踩
article
python-爬虫（可直接使用）
文章浏览阅读1.1w次，点赞43次，收藏270次。python-爬虫（可直接使用）python-爬虫（可直接使用）爬虫（WebScraping）是指通过编程自动化地获取互联网上的信息的过程。爬虫的目的通常是从网页中抓取数据，进行数据分析、处... [详细]
赞
踩
article
时间序列预测模型实战案例(二)(Holt-Winter)(Python)结合K-折交叉验证进行时间序列预测实现企业级预测精度(包括运行代码以及代码讲解)_holt-winters
文章浏览阅读1.5k次，点赞8次，收藏12次。MAE的误差大概在0.11,以下数据均是预测未知数据。Holt-Winters模型，也称为三重指数平滑模型，是一种经典的时间序列预测模型，用于处理具有趋势和季节性的时间序列数据。Holt-Win... [详细]
赞
踩
article
Unable to create process using ‘D:\Anaconda3\python.exe D:\Anaconda3\Scripts\conda-script.py shell.c
文章浏览阅读1w次，点赞20次，收藏17次。记录一下和Anacondaprompt斗智斗勇的一天，早上打开电脑，准备用prompt打开jupyter写点东西，结果人傻啦，报错无法启动进程。。。注意是先报错，后进入起始位置可以输入cmd指令，... [详细]
赞
踩
article
python csv读取方法及常用的csv读取代码_如何读取csv文件
文章浏览阅读5.6k次，点赞2次，收藏12次。在“installcsvba”这个文件夹中新建一个名为“template”的文件夹，其中存放着所有csv文件的二进制文件，比如：接下来，我们以“installcsvba”这个工程为例，来介绍一下... [详细]
赞
踩
article
地图结构 | 图解维诺图Voronoi原理(附C++/Python/Matlab仿真)
文章浏览阅读4.1k次，点赞95次，收藏100次。维诺图的应用涵盖了多个领域，包括计算机图形学、地理信息系统、计算机视觉等。本文介绍维诺图在运动规划中的概念，并结合C++/Python/Matlab三种实现加深理解，为后续基于维诺图的路径规... [详细]
赞
踩
article
AI机器学习实战 | 使用 Python 和 scikit-learn 库进行情感分析
文章浏览阅读5.5k次，点赞123次，收藏181次。上述代码完成了一个简单的情感分析任务。根据具体需求和数据集，您可能需要调整预处理步骤、特征提取方法和支持向量机参数。此外，还可以尝试使用其他机器学习算法，如神经网络、决策树、随机森林等，以... [详细]
赞
踩
article
时间序列预测模型实战案例(三)(LSTM)(Python)(深度学习)时间序列预测(包括运行代码以及代码讲解)_lstm预测模型
文章浏览阅读6.9k次，点赞26次，收藏138次。LSTM（LongShort-TermMemory）是一种常用的循环神经网络（RNN）模型，用于处理序列数据，具有记忆长短期的能力。在时间序列预测中，LSTM既可以多元预测机制又可以作为单元... [详细]
赞
踩
article
【Python&语义分割】Segment Anything（SAM）模型详细使用教程+代码解释（一）
文章浏览阅读1.1k次。SegmentAnything可以实现对任意物体的识别和分割提供了简单易用的接口，用户只需要通过提示，即可进行物体识别和分割操作，今天给大家分享一下SAM的源码。【Python&语义分割】SegmentAnythin... [详细]
赞
踩
article
用 Pyinstaller 模块将 Python 程序打包成 exe 文件（全网最全面最详细，万字详述）_pyinstaller打包
文章浏览阅读4.3w次，点赞291次，收藏1.3k次。本文一步一步地教你如何用Pyinstaller模块将Python程序打包成exe文件！这篇教程绝对是全网最全面、最详细的教程！包含五种打包的方法，从简单到复杂依次是：一般打包方法、虚拟环... [详细]
赞
踩
article
Python CNN卷积神经网络实例讲解，CNN实战，CNN代码实例，超实用
文章浏览阅读2.4w次，点赞62次，收藏642次。PythonCNN卷积神经网络实例讲解，CNN实战，CNN代码实例，套用简单_pythoncnnpythoncnn一、CNN简介1.神经网络基础输入层（Inputlayer），众多神经元（N... [详细]
赞
踩

python selenium 爬虫，使用代理，和 python 爬取代理网站，保存ip_selenium设置ip代理后但还是本地ip

selenium 使用代理

Python “贪吃蛇”游戏，在不断改进中学习pygame编程

FastAPI 库（Python 的 Web 框架）基本使用指南（二）

Python Get()函数用法介绍_python中get函数用法

【Python/网络安全】 Git漏洞之Githack工具基本安装及使用详析

Python----网络爬虫

Python：核心知识点整理大全11-笔记

Python web实战之Django的文件上传和处理详解_django上传

【Python】一文带你掌握数据容器之集合，字典

【Python 零基础入门】Pandas

【文末送书】Python OpenCV从入门到精通

python-爬虫（可直接使用）

时间序列预测模型实战案例(二)(Holt-Winter)(Python)结合K-折交叉验证进行时间序列预测实现企业级预测精度(包括运行代码以及代码讲解)_holt-winters

Unable to create process using ‘D:\Anaconda3\python.exe D:\Anaconda3\Scripts\conda-script.py shell.c

python csv读取方法及常用的csv读取代码_如何读取csv文件

地图结构 | 图解维诺图Voronoi原理(附C++/Python/Matlab仿真)

AI机器学习实战 | 使用 Python 和 scikit-learn 库进行情感分析

时间序列预测模型实战案例(三)(LSTM)(Python)(深度学习)时间序列预测(包括运行代码以及代码讲解)_lstm预测模型

【Python&语义分割】Segment Anything（SAM）模型详细使用教程+代码解释（一）

用 Pyinstaller 模块将 Python 程序打包成 exe 文件（全网最全面最详细，万字详述）_pyinstaller打包

Python CNN卷积神经网络实例讲解，CNN实战，CNN代码实例，超实用

python selenium 爬虫，使用代理 ，和 python 爬取代理网站，保存ip_selenium设置ip代理后但还是本地ip

selenium 使用代理

python selenium 爬虫，使用代理，和 python 爬取代理网站，保存ip_selenium设置ip代理后但还是本地ip