基于 windowsXP/Linux 搭建高可用代理服务器集群


基于 windowsXP/Linux 搭建高可用代理服务器集群

  • 1 需求:

    • 爬虫需要代理服务, 突破网站限制. 要求 IP可变\稳定\节约\
  • 2 方案:

    • 购买N台云服务器 VPS, 需要有固定 IP, 公网可访问. 用于代理上游.
    • 购买 N 个电信/移动/联通拨号资源. 要求可拨号/可远程(RDP
  • 3 注意事项:

    • 拨号资源 IP 不固定, 拨号后需要能够通过公网访问.
    • 客户端, WindowsXP, 下游代理服务器
    • VPS-Server, 服务端, 管理代理服务器VPS和客户端.
    • VPS-Proxy, 代理服务器, 绑定客户端做为代理下游
  • 4 整体流程

    • 准备文件, 包含 squid 绿色安装包/客户端程序(python, 打包成 exe)/一些自动化脚本/
    • 首次使用 RDP连接 XP, 使用 FTP 或者使用磁盘共享功能, 使得程序能够运行在XP 上.
    • 方案1: 直接使用磁盘共享, 所有文件通过远程磁盘拷贝. 在 XP 进去磁盘, 运行即可
    • 方案2: 磁盘共享 FTP 脚本, FTP 服务器共享其余文件. 在 XP 进入磁盘, 运行即可.
    • 方案3: 所有文件共享在 FTP 服务器上. 进入 XP, 手动执行 CMD, 粘贴 FTP/运行命令.
    • 方案4: 使用磁盘共享或者 FTP, RDP 支持初始化执行程序. 不可行, 需要 RDP 后设置可执行成立列表
  • 5 客户端程序流程

    • 启动
    • 将squid绿色安装包(压缩文件) 复制解压到 C:\squid\
    • 将客户端程序/相关文件复制到桌面
    • 识别拨号账号/密码. 不能使用轮训, 因为多个 XP 同时测试拨号会有造成拨号失败. 手动输入模式. 成功保存在文件中.
    • 和初始化服务器通信, 获取 代理服务器VPS IP, 用于绑定代理服务器.
    • 把 代理服务器 IP 写入 squid 配置文件, 用于权限管理.
    • 启动 squid 服务.
    • 向 代理服务器 发送心跳包, 获取下一次重新启动时间.
    • 心跳包返回内容可以有下次拨号时间\重启\退出
  • 6 服务器程序流程

    • 服务器程序分为两部分.
    • a, VPS-Server, 代理服务器 VPS 向服务器注册\注销操作; 客户端获取代理服务器 VPS 的 IP.
    • b, VPS-Proxy, 代理服务器 VPS.
    • 初始化配置
    • 关闭防火墙, 安装 iptables-services, 配置/etc/sysconfig/iptables 并启动 iptables
    • 安装 http-tools(htpasswd, 管理 squid 账号授权)
    • 安装 squid 服务
    • 启动 VPS-Server.
    • 启动 VPS-Proxy.
    • VPS-Proxy 访问 VPS-Server, 注册/注销代理服务器.
    • VPS-Server 收到客户端申请代理服务器请求时, 返回可用的 VPS-Proxy IP.
    • VPS Server 将 N 个 VPS-Proxy 和 M 个客户端绑定信息持久化.
    • VPS-Proxy 每隔固定时间清除服务端 Squid.conf 下游配置.
    • VPS-Proxy 在重新启动 squid 之前, 根据客户端时间和 VPS-Proxy squid重启时间矫正为客户端下次心跳时间, 返回给客户端.
    • VPS-Proxy 到重启 Squid 时间后, 把客户端列表作为代理下游 写入 Squid.conf(含 squid 账号管理), 重新启动 Squid 服务.
  • VPS-Proxy 把绑定的客户端列表持久化.

生成 RDP 文件(txt 文本), 重要参数如下

  • full address:s:{WindowsXP-IP}:{WindowsXP-Port}
  • username:s:{WindowsXP-UserName}
  • password 51:b:{Windows Password, for byte}
  • drivestoredirect:s:{LocalDriver,Ex: E:\};
  • connection type:i:6
  • authentication level:i:0 这里需要注意, WindowsPassword 是哈希, 用工具可以生成


客户端 start.bat

  1. cd "C:\Documents and Settings\Administrator\桌面\"
  2. cls
  3. if exist "C:\Documents and Settings\Administrator\桌面\socket_client.exe" (
  4. cls
  5. echo file has exists...
  6. xcopy /E /y "\\tsclient\E\adsl\client\dist\socket_client.exe" "C:\Documents and Settings\Administrator\桌面\socket_client.exe"
  7. xcopy /E /y "\\tsclient\E\adsl\client\dist\scripts\run_client.bat" "C:\Documents and Settings\Administrator\桌面\"
  8. ) else (
  9. :: copy 压缩squid包, 可以替换为 ftp 形式
  10. copy \\tsclient\F\adsl\client\soft\squid.zip C:\squid.zip
  11. :: 解压文件到指定目录, 静默解压
  12. "C:\Program Files\WinRAR\winRar.exe" -o+ x -ibck C:\squid.zip C:\
  13. :: 递归/覆盖copy程序文件
  14. xcopy /E /y "\\tsclient\E\adsl\client\dist\*" "C:\Documents and Settings\Administrator\桌面\"
  15. )
  16. "C:\Documents and Settings\Administrator\桌面\socket_client.exe" --client
  17. pause

管理 squid

  1. net stop squid
  2. :: 撤销 squid 服务
  3. C:\squid\sbin\squid.exe -r
  4. :: 注册 squid 服务
  5. C:\squid\sbin\squid.exe -i
  6. :: 检查 squid 配置
  7. C:\squid\sbin\squid.exe -z
  8. net start squid
  9. :: pause


  1. rasdial /disconnect
  2. :: 暂停2秒
  3. ping 0 -n 2 -w 1000 > /null
  4. rasdial 宽带连接 adsl账号 adsl密码

客户端 squid 版本是2.7, 重要配置如下

  1. acl remove_server src # server ip
  2. http_access allow remove_server
  3. # 关闭日志文件信息
  4. access_log none
  5. cache_log none
  6. cache_store_log none
  7. # 关闭源 IP 设置
  8. via off
  9. cache_vary off
  10. forwarded_for off

Py2exe 打包 python 程序

  1. import sys
  2. from distutils.core import setup
  3. import py2exe
  4. sys.argv.append('py2exe')
  5. options = {"py2exe":
  6. {"compressed": 1,
  7. "optimize": 2,
  8. # "ascii": 1,
  9. #"includes":["encodings", "encodings.*"],
  10. #'dll_excludes': ['w9xpopen.dll', "SHELL32.dll"],
  11. "bundle_files": 1
  12. }}
  13. setup(
  14. options = options,
  15. console=[{"script": "socket_client.py"},],
  16. #windows=[{"script": "socket_client.py"},],
  17. data_files=[
  18. ("scripts",["scripts\\start_client_squid.bat", "scripts\\connect_adsl.bat", "scripts\\account.exe", "run_client.bat",]),
  19. ("templates", ["templates\\squid.client.template", "templates\\adsl.client.template"])
  20. ],
  21. name = "socket client",
  22. author="zhipeng",
  23. zipfile=None,
  24. )



  1. SQUID_USER="squid"
  2. SQUID_PASSWD="proxy_squid"
  3. service squid stop
  4. # install htpasswd agent, squid server, iptables manager
  5. yum install -y screen httpd-tools squid iptables-services
  6. # change owner squid.conf
  7. chown zhipeng /etc/squid/squid.conf
  8. squid -k parse
  9. squid -z
  10. # create password file
  11. htpasswd -c -b /etc/squid/passwd $SQUID_USER $SQUID_PASSWD
  12. # 获取本地公网 ip. 仅限阿里云. 如果不可以, 考虑其他方式.
  13. ifconfig eth1 |grep inet|awk '{print $2}' > net_ip
  14. # copy iptables to sys
  15. cp iptables.template /etc/sysconfig/iptables
  16. systemctl stop firewalld
  17. systemctl mask firewalld
  18. systemctl enable iptables
  19. service iptables restart
  20. service squid start

启动 squid

  1. service squid stop
  2. /etc/squid/squid.conf.default > /etc/squid/squid.conf
  3. squid -k parse > /dev/null
  4. squid -z > /dev/null
  5. service squid start
  6. cat /etc/squid/squid.conf |grep -e "^cache_peer" | awk '{print $2}' | xargs echo "reset adsl ip:"

server 管理

  1. loc_ip=`ifconfig eth1 |grep inet|awk '{print $2}'`
  2. loc_port=4000
  3. daemon=""
  4. server=""
  5. restart=""
  6. setexit=""
  7. for i in "$@"
  8. do
  9. echo check args: [$i]
  10. if [[ "$i" == "--daemon" || "$i" == "-d" ]]
  11. then
  12. daemon="--daemon"
  13. echo use daemon ..
  14. elif [[ $i == "--server" ]]
  15. then
  16. server="--server"
  17. echo "run server .."
  18. elif [[ $i == "--restart" ]]
  19. then
  20. restart="--restart"
  21. echo "restart server .."
  22. elif [[ "$i" == "--exit" ]]
  23. then
  24. setexit="--exit"
  25. echo "exit server .."
  26. fi
  27. done
  28. if [[ $setexit == "--exit" && $restart == "--restart" ]]
  29. then
  30. echo exit: params error, please input --exit or --restart
  31. else
  32. echo python socket_server.py $loc_ip $loc_port $server $daemon $restart $setexit
  33. fi

代理服务器 squid 重要配置

  1. # 关闭代理跳转信息
  2. request_header_access Via deny all
  3. request_header_access X-Forwarded-For deny all
  4. # 用户授权
  5. auth_param basic program /usr/lib64/squid/basic_ncsa_auth /etc/squid/passwd
  6. acl auth_user proxy_auth REQUIRED
  7. http_access allow auth_user
  8. # 设置上游代理(本文理解为下游)
  9. # set parent
  10. {cache_peer}
  11. #cache_peer sibling 3128 0 no-query default
  12. #cache_peer parent 3128 0 no-query default login=user:password
  13. never_direct allow all

服务器 iptables ,开放某个端口

-A INPUT -p tcp -m state --state NEW -m tcp --dport 3828 -j ACCEPT


