赞
踩
老爸说他有个照片文件夹打不开了,让我过去看看,一瞅,好家伙,加密压缩包尘封老照片呀。
既然加密,没准还有意外收货。
作为一个“精灵鬼”,这么有价值的数据,我必须帮老爸解开呀。
解密压缩包的思路是什么?
答:通过各种密码去尝试解压文件。
用什么解压文件?
答:zip
使用 zipfile
,rar
使用 rarfile
,已经有 Python 大佬给我们写好啦,只需要调用它们的方法即可。
密码从哪里找?
答:程序自行运算或者找密码本。
思路整理清楚之后,就可以开始了。
zipfile
:Python 内置,无需安装;
rarfile
:需要安装一下,文档参照:https://rarfile.readthedocs.io/api.html。
解压文件使用二者生成对象的 extractall
方法即可。
以下内容以 zipfile
库进行举例,举一反三即可。
先默默通过 zipfile
解压一个没有密码的文件,试试手感。
测试文件自己进行打包压缩即可,先尝试英文或者数字文件命名,在尝试中文命名。
import zipfile
try:
# 创建 ZipFile 对象
with zipfile.ZipFile('测试文件.zip') as zfile:
# 解压文件
zfile.extractall(path='./')
print('文件解压成功')
except:
print('失败啦!')
完成任务,成功解压文件,zip
文件和 python 代码放置在同一目录。
解压带密码的文件
下面假装不知道密码,通过密码进行解压,设置密码为 1234
。
import zipfile
try:
# 创建 ZipFile 对象
with zipfile.ZipFile('511.zip') as zfile:
# 解压文件
zfile.extractall(path='./', pwd=b"1234")
print('文件解压成功')
except:
print('失败啦!')
成功解压,后文就可以通过这种思路,对压缩包进行解压。
中文乱码问题
在测试的时候,还发现了如果文件名是中文,解压之后文件名出现乱码情况,修正它。
找到 Python 安装中的 Lib
文件夹,然后打开 zipfile.py
文件,直接修改源码。
搜索 fname_str = fname.decode("cp437")
,再后面添加如下内容。
fname_str = fname_str.encode("cp437").decode('gbk')
搜索 filename = filename.decode('cp437')
,再后面追加如下代码。
filename = filename.encode("cp437").decode('gbk')
保存该文件,再对测试文件进行解压,解压成功,文件名无错误。
进入正式环节,接下来就要解密老爸的压缩包了,这么有价值的压缩包,可别打不开。
假设老爸的密码是 4 位,可以直接编写如下代码进行测试。
提前准备测试压缩包,密码为了好破解设置为 aaaf
,代码如下:
import zipfile def ext_file(pwd): try: # 创建 ZipFile 对象 with zipfile.ZipFile('测试中文.zip') as zfile: # 解压文件 zfile.extractall(path='./', pwd=pwd.encode('utf-8')) print('文件解压成功') return True except Exception as e: print('失败啦!', e) return False # 先“细致入微”的实现一下,以后有好思路在修改 def get_pwds(my_password_str): for i1 in range(len(my_password_str)): for i2 in range(len(my_password_str)): for i3 in range(len(my_password_str)): for i4 in range(len(my_password_str)): yield my_password_str[i1] + my_password_str[i2] + my_password_str[i3] + my_password_str[i4] if __name__ == '__main__': my_password_str = "abcdefghijklmnopqrstuvwxyz0123456789" for pwd in get_pwds(my_password_str): print("正在测试密码:", pwd) yield_pwd = pwd ret = ext_file(yield_pwd) if ret: print("解密成功,密码是", yield_pwd) break
非常简单的运行几秒之后,文件解压成功。
正在测试密码:aaaa
失败啦!Bad password for file '测试中文.txt'
正在测试密码:aaab
失败啦!Bad password for file '测试中文.txt'
正在测试密码:aaac
失败啦!Bad password for file '测试中文.txt'
正在测试密码:aaad
失败啦!Bad password for file '测试中文.txt'
正在测试密码:aaae
失败啦!Bad password for file '测试中文.txt'
正在测试密码:aaaf
文件解压成功
解密成功,密码是 aaaf
此时相信大佬们已经发现问题,如果密码不是 4 位,是不确定的位数,那我那一处细致入微的循环操作,就要修改了。
而且我不知道老爸的密码是多少位数的,这就有点难度了。
更加优秀的解法
在 Python 中已经内置好了一个迭代器,可用于从一个字符串中固定的取出指定位数的密码,测试代码如下:
import itertools
my_pwdstr = 'abcdefghijklmnopqrstuvwxyz0123456789'
def ret_pwd():
for x in itertools.permutations(my_pwdstr, 4):
yield ''.join(x)
for item in ret_pwd():
print(item)
上述代码用到了 itertools.permutations
,该函数的用法如下:
# 函数原型
itertools.permutations(iterable, r=None)
连续返回由 iterable
元素生成长度为 r
的排列。
如果 r
未指定或为 None
,r
默认设置为 iterable
的长度,这种情况下,生成所有排列。
所以使用上述代码,可以快速的生成指定位数的密码,后续只需要传入老爸密码的位数,即可不变动代码就进行程序测试了。
import zipfile import itertools def ext_file(pwd): try: # 创建 ZipFile 对象 with zipfile.ZipFile('测试中文.zip') as zfile: # 解压文件 zfile.extractall(path='./', pwd=pwd.encode('utf-8')) print('文件解压成功') return True except Exception as e: print('失败啦!', e) return False def get_pwds(my_password_str, nums): for x in itertools.permutations(my_password_str, nums): yield ''.join(x) if __name__ == '__main__': my_password_str = "abcdefghijklmnopqrstuvwxyz0123456789" for pwd in get_pwds(my_password_str, 4): print(len(pwd)) print("正在测试密码:", pwd) yield_pwd = pwd ret = ext_file(yield_pwd) if ret: print("解密成功,密码是", yield_pwd) break
经过改良之后,你可以动态控制密码的长度了,如果需要特殊符号也可以继续扩充 my_password_str
字符串。
密码的获取一定要自己生成吗?
答:有种文件叫做密码本,所以去找到一些,然后逐行读取就好了。
一个个的解密太慢了,有高效的办法吗?
答:多线程或者多进程破解,一个进程读一个密码本,每个进程下面在启用几个线程去分段解析密码。
代码虽然写好了,但文件解密我用多线程轮询了 2 天,还是没有解开(相当真实的体验了)。
由于不知道密码组成和密码位数,也不知道算到何年何月去了,我决定还是从老爸那里在找找突破口,“逼问了”一下常用的密码,尤其是知道其银行卡密码之后,得到重要突破点。
解密结果:最终的最终尝试一周之后,文件解开了,密码不复杂,姓的首字母+123789。
本因为是我的姓名+生日,最后得一波感动,然而我还是多虑啦,哈哈哈。
小编这次带来的,是从朋友那里薅到的一套完整的学习路线图,以及配套学习资料,它涵盖了Python学习的方方面面,且文献全彩,字迹清晰,很适合我们学习观看。
下面来看看资料详细内容:
基础真的蛮重要的,因为Python的易应用性很容易让大家产生我什么都会了的感觉,但实际上还是不怎么会。
相关的视频学习资料:
应该有很多人都对爬虫感兴趣吧?
爬虫不只是爬虫工程师会用到,业余时间也可以用来爬点自己想要的东西,又或者是做兼职也是可以的,比如日常办公自动化、电商抓取商品信息、分析销售数据做报表等等。
大部分爬虫都是按“发送请求——获得页面——解析页面——抽取并储存内容”这样的流程来进行,这其实也是模拟了我们使用浏览器获取网页信息的过程。
所以爬虫的简要学习路径大概有:
相关的视频学习资料:
数据分析也是当下的一大热门方向,用Python来做的话比其他语言强很多。
但往往只会数据分析还是差点意思,如果能具备爬虫能力来爬取数据就更好了。(分析爬虫抓取的数据,分析规律,用于商业化)
相关的学习资料:
企业需要定期将冷数据从业务数据库中转移出来存储到一个专门存放历史数据的仓库里面,各部门可以根据自身业务特性对外提供统一的数据服务,这个仓库就是数据仓库。
传统的数据仓库集成处理架构是ETL,利用ETL平台的能力,E=从源数据库抽取数据,L=将数据清洗(不符合规则的数据)、转化(对表按照业务需求进行不同维度、不同颗粒度、不同业务规则计算进行统计),T=将加工好的表以增量、全量、不同时间加载到数据仓库。 相关的学习资料:
现在不是各种吹人工智能么,机器学习就是人工智能的一个分支,它的应用太广泛了,比如自然语言处理,搜索引擎,各种识别技术,数据挖掘等等。
这难度不用我多说了吧,不会点算法就别碰,一碰就是各种高斯过程回归、线性判别分析、决策树、线性回归…
相关的学习资料:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。