赞
踩
受友人所托,写了一个爬取智联招聘信息的爬虫,与大家分享。
本文将介绍如何实现该爬虫。
目录
以https://xiaoyuan.zhaopin.com/full/538/0_0_160000_1_0_0_0_1_0 为例。
网页的组织结构如下:
将网页代码保存为html文件(文件见最后链接),使用的软件是Sublime Text,我们所需的内容如下图所示:
那么我们需要爬取的内容包括(以上图为例):
# -*- coding:utf-8 -*-
import urllib.request
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。