当前位置:   article > 正文

爬虫(三)突破JWT认证_爬虫 jwt

爬虫 jwt

JWT认证

一、工作原理

	鉴权原理和cookie、session认证差不多,不多说直接上图
  • 1


token一般分为三部分:头部、载体、签名

二、具体案例

1.1 、以新版电子税务局为例,rpa在拿到税务数字账户cookie后,验证cooke有效性的过程中,发现无法唤醒新开的浏览器(表象:页面空白)

正常页面:
在这里插入图片描述
cookie初次唤醒页面(非必现):
在这里插入图片描述
在此之前,其实我并不知道JWT这个概念,但是大概知道应该是鉴权没通过的导致的,并且看到页面报错
在这里插入图片描述
在这里插入图片描述

1.2、比对正常rpa登录、cookie登录页面参数 ,观察发现有个区别,就是在cookie登录时,凡是跳转后页面空白的情况,大概率这个字段的值都是空的

在这里插入图片描述
初步断定这个字段应该是服务端生成的,这就是问题所在,尝试将rpa登录后中的token保存下来,再塞到cookie登录的环节中,刷新页面发现是可以的,大功告成。
在这里插入图片描述

1.3、关键模块实现
    /**
     * 获取上传token
     */
    async upload_token() {
        var token_data = await this.page.evaluate(() => {
            const token_data = {};
            for (let i = 0; i < localStorage.length; i++) {
                const key = localStorage.key(i);
                token_data[key] = localStorage.getItem(key);
            }
            return token_data
        });
        fs.writeFileSync("token.json", JSON.stringify(token_data))
        console.log("------token上传成功------")
    }
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
    /**
    * cookie登录
    */
    async cookie_login() {
        console.log("------开始cookie登录------")
        await this.access_login_page();
        await this.page.deleteCookie();
        // 添加cookie
        await this.page.setCookie(cookies_array.at(0), cookies_array.at(1));
        await this.page.goto(cfg.login_page_url);
        await this.sleep(1000 * 10)
        for (var i = 0; i < 3; i++) {
            if (await this.page.$(cfg.top_navigtor_locator)) {
                break
            }
            console.log("第%d次尝试刷新页面", i)
            // 添加token
            await this.page.evaluate((key, value) => {
                localStorage.setItem(key, value);
            }, "dunm_data", cookies_array.at(2)["dunm_data"])
            await this.page.reload()
            await this.sleep(1000 * 5)
        }
    }
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24

篇外话:入职新公司一周多了,上面是刚做的就随手记录下,平常主要用nodejs的puppeteer做爬虫,然后还会有接口的开发,涉及koa框架的使用,其他的,怎么说呢,之前没接触过先学完…

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家小花儿/article/detail/893670
推荐阅读
相关标签
  

闽ICP备14008679号