QQ登录

只需要一步,快速开始

APP扫码登录

只需要一步,快速开始

手机号码,快捷登录

泡泡马甲APP 更多内容请下载泡泡马甲手机客户端APP 立即下载 ×
查看: 1560|回复: 0

[Python] 记一次用python破解zip文件密码的经历

[复制链接]

等级头衔

积分成就    金币 : 2806
   泡泡 : 1516
   精华 : 6
   在线时间 : 1244 小时
   最后登录 : 2024-5-5

丰功伟绩

优秀达人突出贡献荣誉管理论坛元老

联系方式
发表于 2021-4-22 21:37:14 | 显示全部楼层 |阅读模式
       之前在家里的老电脑中,发现一个加密zip压缩包,由于时隔太久忘记密码了,依稀记得密码是6位字母加数字,网上下载了很多破解密码的软件都没有效果,于是想到自己用Python写一个暴力破解密码的脚本。
/ T3 V9 v# q) W: d5 ?0 N# L& S% Y       Python 有一个内置模块 zipfile 可以解压 zip 压缩包。先来测试一波:创建一个测试文件,压缩,设置解压密码为123。
; ^: m- g8 I3 e8 C1 e% q. w( {3 C 1.jpg
+ k6 c8 Q' j" w1 q3 h
  1. import zipfile
  2. # 创建文件句柄
  3. file = zipfile.ZipFile("测试.zip", 'r')
  4. # 提取压缩文件中的内容,注意密码必须是bytes格式,path表示提取到哪
  5. file.extractall(path='.', pwd='123'.encode('utf-8'))
      运行效果如下图所示,提取成功。: F( B) C2 [* W4 C. }
2.jpg
. X2 K: l- c( T5 j2 V
       既然如此,那我不停尝试所有可能的密码组合去解压缩不就行了嘛~好了,开始破解老文件的密码。为了提高速度,我还加了多线程的代码:
3 B* \3 G; D8 n5 w
  1. import zipfile
  2. import itertools
  3. from concurrent.futures import ThreadPoolExecutor
  4. def extract(file, password):
  5.     if not flag: return
  6.     file.extractall(path='.', pwd=''.join(password).encode('utf-8'))
  7. def result(f):
  8.     exception = f.exception()
  9.     if not exception:
  10.         # 如果获取不到异常说明破解成功
  11.         print('密码为:', f.pwd)
  12.         global flag
  13.         flag = False
  14. if __name__ == '__main__':
  15.     # 创建一个标志用于判断密码是否破解成功
  16.     flag = True
  17.     # 创建一个线程池
  18.     pool = ThreadPoolExecutor(100)
  19.     nums = [str(i) for i in range(10)]
  20.     chrs = [chr(i) for i in range(65, 91)]
  21.     # 生成数字+字母的6位数密码
  22.     password_lst = itertools.permutations(nums + chrs, 6)
  23.     # 创建文件句柄
  24.     zfile = zipfile.ZipFile("加密文件.zip", 'r')
  25.     for pwd in password_lst:
  26.         if not flag: break
  27.         f = pool.submit(extract, zfile, pwd)
  28.         f.pwd = pwd
  29.         f.pool = pool
  30.         f.add_done_callback(result)
      然而,事情并没有那简单……代码跑一会儿,内存爆了!8 D6 C0 m' J; z, S
3.jpg
+ F  f1 t( b% ~2 ?  s* Z0 @( K
       于是,为了找寻问题所在,我就去查看了一下源码,发现ThreadPoolExecutor默认使用的是**队列。而程序中尝试密码的速度跟不上生产密码的速度,就会把生产任务无限添加到队列中。导致内存被占满。内存直接飙到95:
1 e$ Y* G8 @9 r2 H 4.jpg " s' T* m. O6 ^( z. q: d8 [( u
       找到病根儿,剩下的就是对症下药了。继承并重写了ThreadPoolExecutor类中的_work_queue属性,将**队列改成有界队列,这样就不会出现内存爆满的问题,看代码:
& f' v; S1 i# ~( i/ V
  1. import queue
  2. from concurrent.futures import ThreadPoolExecutor
  3. class BoundedThreadPoolExecutor(ThreadPoolExecutor):
  4.     def __init__(self, max_workers=None, thread_name_prefix=''):
  5.         super().__init__(max_workers, thread_name_prefix)
  6.         self._work_queue = queue.Queue(self._max_workers * 2) # 设置队列大小
      用自定义的BoundedThreadPoolExecutor类替代前面代码中的ThreadPoolExecutor。再次执行……程序输入如下图内容:, F9 n+ U% R% M+ p# D
5.jpg

$ _) W9 c  d8 `4 O9 c% x' Y* n       Bingo!破解成功!(原来密码如此简单……)
) P: e% j' e4 a9 h+ @       话说回来,毕竟这个压缩包我是隐约知道它的位数和范围(字母和数字),所以破解出来需要的时间是可以忍受的。如果有天你在网上找了一个无人认领的加密压缩包,想要一窥究竟但又并不知道它有多少位密码,那我只能祝你好运啦~
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|paopaomj.COM ( 渝ICP备18007172号 )

GMT+8, 2024-5-6 00:03

Powered by paopaomj X3.4 © 2016-2024 sitemap

快速回复 返回顶部 返回列表