赞
踩
建立在已经爬取所需要的岗位信息之后,筛选出来我们需要投递的岗位的信息放到指定的目录之后
还未爬取到每个岗位的链接的进入:https://blog.csdn.net/weixin_52001949/article/details/135452969
以下是关键代码,想要获取完整代码,关注公众号:“麻不辣青汤" 点击获取源码
#1. 获取cookies
cookies = boss.get_cookies()
cookies_json = json.dumps(cookies, indent=4)
#2. 登录完成后,将cookies保存到本地文件
with open(cookie文件名, "w") as file:
file.write(cookies_json)
print("Cookies 已保存到 cookies.json 文件")
# 1.打开网页,注入cookies
boss.get(url)
for cookie in cookies_loaded:
boss.add_cookie(cookie)
print("---注入Cookies成功")
boss.refresh()
# 2. 等待页面加载完成
for url in df['岗位链接']:
count=count+1
boss.get(url)
等待元素出现('btns',url,5)
已沟通 = boss.find_elements(By.XPATH, "//*[contains(text(), '您与该Boss已沟通过')]")
沟通 = boss.find_elements(By.XPATH, "//*[contains(text(), '沟通')]")
if 已沟通:
之前是否沟通.append('已沟通')
else:
if len(沟通) > 0: boss.find_element(By.XPATH, "//*[contains(text(), '沟通')]").click()
之前是否沟通.append('未沟通')
print(f'爬取中,总岗位数:{需投岗位数}, 当前:{count},岗位链接:{url}')
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。