当前位置:   article > 正文

我爸电脑上有个加密压缩包,我用Python给解开了_python解压带密码的rar文件

python解压带密码的rar文件

每天学习Python新技能

老爸说他有个照片文件夹打不开了,让我过去看看,一瞅,好家伙,加密压缩包尘封老照片呀。

既然加密,没准还有意外收货。

作为一个“精灵鬼”,这么有价值的数据,我必须帮老爸解开呀。

寻找思路

解密压缩包的思路是什么?
答:通过各种密码去尝试解压文件。

用什么解压文件?
答:zip 使用 zipfilerar 使用 rarfile,已经有 Python 大佬给我们写好啦,只需要调用它们的方法即可。

密码从哪里找?
答:程序自行运算或者找密码本。

思路整理清楚之后,就可以开始了。

zipfile 与 rarfile

  • zipfile:Python 内置,无需安装;

  • rarfile:需要安装一下,文档参照:https://rarfile.readthedocs.io/api.html。

解压文件使用二者生成对象的 extractall 方法即可。

以下内容以 zipfile 库进行举例,举一反三即可。

先默默通过 zipfile 解压一个没有密码的文件,试试手感。

测试文件自己进行打包压缩即可,先尝试英文或者数字文件命名,在尝试中文命名。

import zipfile

try:
    # 创建 ZipFile 对象
    with zipfile.ZipFile('测试文件.zip') as zfile:
        # 解压文件
        zfile.extractall(path='./')
        print('文件解压成功')
except:
    print('失败啦!')
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10

完成任务,成功解压文件,zip 文件和 python 代码放置在同一目录。

解压带密码的文件

下面假装不知道密码,通过密码进行解压,设置密码为 1234

import zipfile

try:
    # 创建 ZipFile 对象
    with zipfile.ZipFile('511.zip') as zfile:
        # 解压文件
        zfile.extractall(path='./', pwd=b"1234")
        print('文件解压成功')
except:
    print('失败啦!')
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10

成功解压,后文就可以通过这种思路,对压缩包进行解压。

中文乱码问题
在测试的时候,还发现了如果文件名是中文,解压之后文件名出现乱码情况,修正它。

找到 Python 安装中的 Lib 文件夹,然后打开 zipfile.py 文件,直接修改源码。

搜索 fname_str = fname.decode("cp437"),再后面添加如下内容。

fname_str = fname_str.encode("cp437").decode('gbk')
  • 1

搜索 filename = filename.decode('cp437'),再后面追加如下代码。

filename = filename.encode("cp437").decode('gbk')
  • 1

保存该文件,再对测试文件进行解压,解压成功,文件名无错误。

解密文件

进入正式环节,接下来就要解密老爸的压缩包了,这么有价值的压缩包,可别打不开。

假设老爸的密码是 4 位,可以直接编写如下代码进行测试。

提前准备测试压缩包,密码为了好破解设置为 aaaf,代码如下:

import zipfile


def ext_file(pwd):

    try:
        # 创建 ZipFile 对象
        with zipfile.ZipFile('测试中文.zip') as zfile:
            # 解压文件
            zfile.extractall(path='./', pwd=pwd.encode('utf-8'))
            print('文件解压成功')
            return True
    except Exception as e:
        print('失败啦!', e)
        return False

# 先“细致入微”的实现一下,以后有好思路在修改
def get_pwds(my_password_str):
    for i1 in range(len(my_password_str)):
        for i2 in range(len(my_password_str)):
            for i3 in range(len(my_password_str)):
                for i4 in range(len(my_password_str)):
                    yield my_password_str[i1] + my_password_str[i2] + my_password_str[i3] + my_password_str[i4]


if __name__ == '__main__':
    my_password_str = "abcdefghijklmnopqrstuvwxyz0123456789"
    for pwd in get_pwds(my_password_str):
        print("正在测试密码:", pwd)
        yield_pwd = pwd
        ret = ext_file(yield_pwd)
        if ret:
            print("解密成功,密码是", yield_pwd)
            break
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34

非常简单的运行几秒之后,文件解压成功。

正在测试密码:aaaa
失败啦!Bad password for file '测试中文.txt'
正在测试密码:aaab
失败啦!Bad password for file '测试中文.txt'
正在测试密码:aaac
失败啦!Bad password for file '测试中文.txt'
正在测试密码:aaad
失败啦!Bad password for file '测试中文.txt'
正在测试密码:aaae
失败啦!Bad password for file '测试中文.txt'
正在测试密码:aaaf
文件解压成功
解密成功,密码是 aaaf
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13

此时相信大佬们已经发现问题,如果密码不是 4 位,是不确定的位数,那我那一处细致入微的循环操作,就要修改了。
而且我不知道老爸的密码是多少位数的,这就有点难度了。

更加优秀的解法
在 Python 中已经内置好了一个迭代器,可用于从一个字符串中固定的取出指定位数的密码,测试代码如下:

import itertools
my_pwdstr = 'abcdefghijklmnopqrstuvwxyz0123456789'
def ret_pwd():
    for x in itertools.permutations(my_pwdstr, 4):
        yield ''.join(x)

for item in ret_pwd():
    print(item)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

上述代码用到了 itertools.permutations ,该函数的用法如下:

# 函数原型
itertools.permutations(iterable, r=None)
  • 1
  • 2

连续返回由 iterable 元素生成长度为 r 的排列。

如果 r 未指定或为 Noner 默认设置为 iterable 的长度,这种情况下,生成所有排列。

所以使用上述代码,可以快速的生成指定位数的密码,后续只需要传入老爸密码的位数,即可不变动代码就进行程序测试了。

import zipfile
import itertools


def ext_file(pwd):

    try:
        # 创建 ZipFile 对象
        with zipfile.ZipFile('测试中文.zip') as zfile:
            # 解压文件
            zfile.extractall(path='./', pwd=pwd.encode('utf-8'))
            print('文件解压成功')
            return True
    except Exception as e:
        print('失败啦!', e)
        return False


def get_pwds(my_password_str, nums):
    for x in itertools.permutations(my_password_str, nums):
        yield ''.join(x)

if __name__ == '__main__':
    my_password_str = "abcdefghijklmnopqrstuvwxyz0123456789"
    for pwd in get_pwds(my_password_str, 4):
        print(len(pwd))
        print("正在测试密码:", pwd)
        yield_pwd = pwd
        ret = ext_file(yield_pwd)
        if ret:
            print("解密成功,密码是", yield_pwd)
            break
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32

经过改良之后,你可以动态控制密码的长度了,如果需要特殊符号也可以继续扩充 my_password_str 字符串。

扩展思路

密码的获取一定要自己生成吗?
答:有种文件叫做密码本,所以去找到一些,然后逐行读取就好了。

一个个的解密太慢了,有高效的办法吗?
答:多线程或者多进程破解,一个进程读一个密码本,每个进程下面在启用几个线程去分段解析密码。

事件后续

代码虽然写好了,但文件解密我用多线程轮询了 2 天,还是没有解开(相当真实的体验了)。

由于不知道密码组成和密码位数,也不知道算到何年何月去了,我决定还是从老爸那里在找找突破口,“逼问了”一下常用的密码,尤其是知道其银行卡密码之后,得到重要突破点。

解密结果:最终的最终尝试一周之后,文件解开了,密码不复杂,姓的首字母+123789。
本因为是我的姓名+生日,最后得一波感动,然而我还是多虑啦,哈哈哈。

小编这次带来的,是从朋友那里薅到的一套完整的学习路线图,以及配套学习资料,它涵盖了Python学习的方方面面,且文献全彩,字迹清晰,很适合我们学习观看。

下面来看看资料详细内容:

一、Python基础

基础真的蛮重要的,因为Python的易应用性很容易让大家产生我什么都会了的感觉,但实际上还是不怎么会。

在这里插入图片描述

相关的视频学习资料: 在这里插入图片描述

二、爬虫阶段

应该有很多人都对爬虫感兴趣吧?

爬虫不只是爬虫工程师会用到,业余时间也可以用来爬点自己想要的东西,又或者是做兼职也是可以的,比如日常办公自动化、电商抓取商品信息、分析销售数据做报表等等。

大部分爬虫都是按“发送请求——获得页面——解析页面——抽取并储存内容”这样的流程来进行,这其实也是模拟了我们使用浏览器获取网页信息的过程。

所以爬虫的简要学习路径大概有:

  • 学习 Python 包并实现基本的爬虫过程
  • 了解非结构化数据的存储
  • 学习scrapy,搭建工程化爬虫
  • 学习数据库知识,应对大规模数据存储与提取
  • 掌握各种技巧,应对特殊网站的反爬措施
  • 分布式爬虫,实现大规模并发采集,提升效率

相关的视频学习资料: 请添加图片描述

三、Python数据分析

数据分析也是当下的一大热门方向,用Python来做的话比其他语言强很多。

但往往只会数据分析还是差点意思,如果能具备爬虫能力来爬取数据就更好了。(分析爬虫抓取的数据,分析规律,用于商业化)

在这里插入图片描述

相关的学习资料:

四、数据库与ETL数仓

企业需要定期将冷数据从业务数据库中转移出来存储到一个专门存放历史数据的仓库里面,各部门可以根据自身业务特性对外提供统一的数据服务,这个仓库就是数据仓库。

传统的数据仓库集成处理架构是ETL,利用ETL平台的能力,E=从源数据库抽取数据,L=将数据清洗(不符合规则的数据)、转化(对表按照业务需求进行不同维度、不同颗粒度、不同业务规则计算进行统计),T=将加工好的表以增量、全量、不同时间加载到数据仓库。 在这里插入图片描述相关的学习资料在这里插入图片描述

五、Python机器学习

现在不是各种吹人工智能么,机器学习就是人工智能的一个分支,它的应用太广泛了,比如自然语言处理,搜索引擎,各种识别技术,数据挖掘等等。

这难度不用我多说了吧,不会点算法就别碰,一碰就是各种高斯过程回归、线性判别分析、决策树、线性回归…

相关的学习资料:

[所有资料已整合打包好,斯信我或者评论留个言领取即可!]

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/weixin_40725706/article/detail/746363
推荐阅读
相关标签
  

闽ICP备14008679号