Python爬虫进阶必备 | XX快药 sign 加密分析与加密逻辑复写
- 2019 年 10 月 7 日
- 笔记
今日份的网站
aHR0cDovL3d3dy5kZGt5LmNvbS9jb21tb2RpdHkuaHRtbD9kZGt5Y2FjaGU9YTdiMTllODc5ZDJmMmYyNzlkMzU2ZjVhZmE2ZDVjZmY=
这个网站的加密比较简单,是那种新手做过一遍就对 JS 逆向充满信心的小练手。
分析请求
先分析请求,看看需要的参数有没什么搞头【图1-1】

图1-1
比较明显的是 sign 其他的参数好像没有什么特别的地方。
先定位 sign 的位置【图1-2】

图1-2
直接搜索参数就看到结果了,点击搜索的结果文件在文件内再搜索一次,可以看到有 3 个结果。【图1-3】

图1-3
到这里就看到 sign 的加密了。
接下来继续分析逻辑,这里的 sign 值是 y
,y
的值是通过MD5(f)
获取的,而f
又是t.get("method") + p + r
的结果,经过一通分析,可以的得到下面的逻辑:
var l = t.keys().sort(), p = ""; l.length; for (var g in l) { var m = l[g]; p += m + t.get(m) } sign = md5(t.get("method") + p + r)
接下来只需要把我们不知道的值通过断点的方式调试出来,这个加密我们就完成解密了。
所以先给不知道的值打上断点,不清楚就打上断点不要怕麻烦,像【图1-4】这样。

图1-4
重新请求一下,就进入到我们打的断点里了,我们可以通过在 console 中打印变量的值来理解逻辑。【图1-5】

图1-5
明白需要的变量的值之后,我们就可以开始扣取 JS 或者用 Python 复写加密的逻辑了。
因为这次的加密比较简单,我们试试用 Python 复写一遍加密。(主要是 Python 的 md5 用起来蛮舒服的)
这里的逻辑比较简单没啥好分析的,我就直接上代码了。
import time from hashlib import md5 def get_sign(): timeStamp = time.time() localTime = time.localtime(timeStamp) strTime = time.strftime("%Y-%m-%d %H:%M:%S", localTime) l = ["method", "orderTypeId", "orgcode", "pageNo", "pageSize", "plat", "platform", "shopId", "t", "v", "versionName"] t = { 'method': 'ddsy.product.query.orgcode.product.list.b2c', 'orderTypeId': '0', 'orgcode': '010502,010503,010504,010505,010506,010507', 'pageNo': '1', 'pageSize': '100', 'plat': 'H5', 'platform': 'H5', 'shopId': '-1', # 't': '2019-9-23 22:4:16', 't': '{}'.format(strTime), 'v': '1.0', 'versionName': '3.2.0' } p = '' for i in range(0, 11): m = l[i] p += m + t.get(m) f = t['method'] + p + '6C57AB91A1308E26B797F4CD382AC79D' print(f) sign = md5value(f).upper() print(sign) return sign def md5value(s): a = md5(s.encode()).hexdigest() return a
到这里其实就没有什么难度了,直接带入 sign 请求就完事了。【图1-6】
