赞
踩
引用上篇对boss直聘每个岗位的源代码获取了之后,对字段的爬取
前言:https://blog.csdn.net/weixin_52001949/article/details/135452969
如有问题可私信关注博主
岗位名、岗位薪资、地区、工作地址、要求年限、学历、职位描述、岗位职责
公司名、公司规模、公司介绍、公司成立日期、行业
将每个字段的信息放在一个列表里,每个岗位一个列表,
岗位=[‘bi1’,‘bi2’,…] ,公司名=[‘a’,‘b’,‘c’,…]
最后用pandas中的Pandas中的DataFrame做成表格输出excel。
思路:
'职位关键字'
职位关键字_text = soup.find(class_='job-keyword-list')
'如果找不到的话该class,报错'
if 职位关键字_text:
text = [li.get_text(strip=True) for li in 职位关键字_text.find_all('li')]
else :
text='无'
职位关键字.append(text)
select 方法返回的是一个列表,包含所有匹配的元素。如果没有找到匹配的元素,它会返回一个空列表。要注意的是,select 方法总是返回一个列表,即使只有一个元素匹配。如果你只对第一个匹配的元素感兴趣,可以使用 select_one 方法,它返回单个元素而不是列表。
标签。返回的是一个元素。
soup.select("p:has(i.icon-scale)")
示例代码:
公司规模=[]
公司规模_text = soup.select_one('p:has(i.icon-scale)')
if 公司规模_text:
text=公司规模_text.get_text(strip=True)
公司规模.append(text)
同理找到class为icon-industry
公司行业_text = soup.select_one('p:has(i.icon-industry)')
if 公司行业_text:
text=公司行业_text.get_text(strip=True)
公司行业.append(text)
完整代码扫码获得
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。