之前在家里的老电脑中,发现一个加密zip压缩包,由于时隔太久忘记密码了,依稀记得密码是6位字母加数字,网上下载了很多破解密码的软件都没有效果,于是想到自己用Python写一个暴力破解密码的脚本。 / {) G; T5 m* I, j* Q, T Python 有一个内置模块 zipfile 可以解压 zip 压缩包。先来测试一波:创建一个测试文件,压缩,设置解压密码为123。8 x% \: k! @- S' f) y# `2 x; o
H4 p1 O6 _- i2 U) J# w$ o
运行效果如下图所示,提取成功。 ! }# K- e" S4 U U, q % P: ^4 j% R, ^) v* T W0 b 既然如此,那我不停尝试所有可能的密码组合去解压缩不就行了嘛~好了,开始破解老文件的密码。为了提高速度,我还加了多线程的代码: 5 D0 M) A' g8 D c+ `- u+ s$ A- e1 r" A3 @
import zipfile
import itertools
from concurrent.futures import ThreadPoolExecutor
def extract(file, password):
if not flag: return
file.extractall(path='.', pwd=''.join(password).encode('utf-8'))
def result(f):
exception = f.exception()
if not exception:
# 如果获取不到异常说明破解成功
print('密码为:', f.pwd)
global flag
flag = False
if __name__ == '__main__':
# 创建一个标志用于判断密码是否破解成功
flag = True
# 创建一个线程池
pool = ThreadPoolExecutor(100)
nums = [str(i) for i in range(10)]
chrs = [chr(i) for i in range(65, 91)]
# 生成数字+字母的6位数密码
password_lst = itertools.permutations(nums + chrs, 6)
# 创建文件句柄
zfile = zipfile.ZipFile("加密文件.zip", 'r')
for pwd in password_lst:
if not flag: break
f = pool.submit(extract, zfile, pwd)
f.pwd = pwd
f.pool = pool
f.add_done_callback(result)
然而,事情并没有那简单……代码跑一会儿,内存爆了! * D1 J' ? e0 K# }' j! S# U3 Q+ y ( @! u( m# C4 I5 X 于是,为了找寻问题所在,我就去查看了一下源码,发现ThreadPoolExecutor默认使用的是**队列。而程序中尝试密码的速度跟不上生产密码的速度,就会把生产任务无限添加到队列中。导致内存被占满。内存直接飙到95: ( n/ v- T% G' }5 S2 V
* T( @& I1 b6 u$ |0 O0 A1 i
找到病根儿,剩下的就是对症下药了。继承并重写了ThreadPoolExecutor类中的_work_queue属性,将**队列改成有界队列,这样就不会出现内存爆满的问题,看代码: L" @ i: Y9 B o) z3 D