base64stego 还不懂base64的隐写，详解15行代码带你领略

2021 年 5 月 18 日
筆記
CTF学习笔记

网上写了好多关于xctf MISC新手篇的base64Stego隐写的教程，但大都不太清楚，基本上都是讲了一段隐写原理，直接上代码了。但是代码是这道题的关键，代码讲了如何解码这个隐写的完整流程，这次我以一个python的源码的解释，完美解决这道题。
可能会花费你很长时间，大约一天半天，但是我们要有信心，恒心！

base64 隐写原理 + 破解隐写的代码

仔细看！！！！！！！
Tr0y’s Blog baseStego
存在隐写的编码末尾都存在 = ，一个 = 隐写 2bit
隐写的编码，解码后，再编码，最后挨着 = 的字符会发生变化。

史上最完全的源码解析

真小白级此题的隐写解码的python解析,

代码分析

# -*- coding: utf-8 -*-
import base64
b64chars = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/'
with open('stego.txt', 'rb') as f:
    bin_str = ''
    for line in f.readlines():
        stegb64 = str(line, "utf-8").strip("\n")
        rowb64 =  str(base64.b64encode(base64.b64decode(stegb64)), "utf-8").strip("\n")
        offset = abs(b64chars.index(stegb64.replace('=','')[-1])-b64chars.index(rowb64.replace('=','')[-1]))
        equalnum = stegb64.count('=') #no equalnum no offset
        if equalnum:
            bin_str += bin(offset)[2:].zfill(equalnum * 2)
        print(''.join([chr(int(bin_str[i:i + 8], 2)) for i in range(0, len(bin_str), 8)]))

1 python 3.8.无法保存

# -*- coding: utf-8 -*-

在 python 3.8 IDE编写的程序文件无法保存，也就无法运行，加上这一行就可以了保存了。

2 这一行为后面求隐写数据提供了标尺，后面再解释

b64chars = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/'

3 python 文件读写

with open('1.txt', 'rb') as f:

python提供的打开文件的方法，不需要关闭文件，即不需要写 f.close() ,但要注意文件操作的代码都写到 f:下面，有格式要求，有缩进。
注意stego.txt要和脚本放到同一目录下。
“r” – 读取 – 默认值。打开文件进行读取，如果文件不存在则报错。
“b” – 二进制 – 二进制模式（例如图像）。
以二进制读入文件数据，也可以直接读入文本数据。
w3school 文件读写
 博主有梦就要去实现它 with open() as f:

4 隐写数据二进制字符串

bin_str = ''

用来存储，隐藏的字符flag, 在后面所有求的的隐写二进制数据都将追加到 bin_str 的尾部

5 readlines()

for line in f.readlines():

可以使用 readline() 方法返回一行：
循环读入文件，每次读取一行，下面就是对每一次读入的二进制数据的一些操作。

6 strip(“\n”)

stegb64 = str(line, "utf-8").strip("\n")  //将读入的二进制串编成文本串，此时和stego.txt中的base64串一样，去除了\n换行符 假！
rowb64 =  str(base64.b64encode(base64.b64decode(stegb64)), "utf-8").strip("\n")  //解码后的又编码的base64串，即原来的base64 真！

可以理解为 utf-8的英文字符和 ASCII的英文字符　编码是一致的。　在任何一种编码格式中　0-127所代表的字符都是一样的
在base64隐写中，如果存在隐写的数据，隐写数据后的base64 和没有隐写数据的base64 在最后一个字符会发生变化，即=后面
一个 = 隐藏 2bit数据。集齐8bit,就可以拼出一个字符串

eg.隐写
stegb64 = IHdyaXRpbmcgaGlkZGVuIG1lc3NhZ2VzIGluIHN1Y2ggYSB3YXkgdGhhdCBubyBvbmV=
rowb64 = IHdyaXRpbmcgaGlkZGVuIG1lc3NhZ2VzIGluIHN1Y2ggYSB3YXkgdGhhdCBubyBvbmU=
这里隐写了数据 ’01’
特别！如果没有变化，也算是一种隐写 ==->’0000′ =->’00’ 这个可能根据不同的隐藏方法有关。我也可以定义只有不同的
eg.strip()
a=” gho stwwl\n”
a.strip(“\n”) = ‘ gho stwwl’
去掉一行首部和尾部的换行符，若要去一边的话还有 rstrip() lstrip()

7 offset 偏离(数字类型)

offset = abs(b64chars.index(stegb64.replace('=','')[-1])-b64chars.index(rowb64.replace('=','')[-1]))

abs() 返回绝对值 V的位置 – U的位置
stegb64.replace(‘=’,”)[-1] 去掉末尾的’=’ 并且返回它的最后一个字符 V
rowb64.replace(‘=’,”)[-1] 去掉末尾的’=’ 并且返回它的最后一个字符 U
index() 返回这个字符在 b64chars 中的位置

8 计算 ‘=’ 的数量

equalnum = stegb64.count('=') #no equalnum no offset
if equalnum:
            bin_str += bin(offset)[2:].zfill(equalnum * 2)

如果存在等号表示隐藏了数据，我们把隐藏的数据转换成二进制存到 bin_str 中以追加的方式

bin(x) 返回一个整数 int 或者长整数 long int 的二进制表示。
bin(1)=’0b1′ 上面的例子就是这个(U V)
bin(2)=’0b10′
bin(4)=’0b100′
因为返回的字符串都有 ‘0b’ 但我们只要二进制数据
[2:] 从 ‘0b’ 之后截取我们取到’1′
但是这个隐写了 2bit 所以用到了 zfill()
.zfill(equalnum * 2) 方法返回指定长度的字符串，原字符串右对齐，前面填充0。
str = ‘1’
str.zfill(2) = ’01’
str.zfill(4) = ‘0001’

经过这次的转换我们求解了 ’01’ 的隐藏数据

经过几个循环

IHdyaXRpbmcgaGlkZGVuIG1lc3NhZ2VzIGluIHN1Y2ggYSB3YXkgdGhhdCBubyBvbmV= ’01’
LCBhcGFydCBmcm9tIHRoZSBzZW5kZXIgYW5kIGludGVuZGVkIHJlY2lwaWVudCwgc3VzcGU= ’00’
Y3RzIHRoZSBleGlzdGVuY2Ugb2YgdGhlIG1lc3M= ’00’
YWdlLCBhIGZvcm0gb2Ygc2VjdXJpdHkgdGhyb3VnaCBvYnNjdXJpdHkuIFS= ’11’

我们得到了 B 0100 0011 这是码ascii

输出

print(''.join([chr(int(bin_str[i:i + 8], 2)) for i in range(0, len(bin_str), 8)]))

int() 函数用于将一个字符串或数字转换为整型。
int(x, base=10)
x — 字符串或数字。
base — 进制数，默认十进制。
join()

Python join() 方法用于将序列中的元素以指定的字符连接生成一个新的字符串。
str.join(sequence)
sequence — 要连接的元素序列。

str = “-“;
seq = (“a”, “b”, “c”); # 字符串序列
print str.join( seq );
结果： a-b-c

[.. for in range(10)]
方括号中循环的用法

为了匹配 sequence 生成一个字符列表以便用于 join();

最后，这些解码的字符就连接到一起了。

动手写一遍吧

Tags: CTF学习笔记

base64stego 还不懂base64的隐写，详解15行代码带你领略

base64 隐写原理 + 破解隐写的代码

史上最完全的源码解析

代码分析

1 python 3.8.无法保存

2 这一行为后面求隐写数据提供了标尺，后面再解释

3 python 文件读写

4 隐写数据二进制字符串

5 readlines()

6 strip(“\n”)

7 offset 偏离(数字类型)

8 计算 ‘=’ 的数量

经过几个循环

输出

动手写一遍吧

VirMach 便宜 VPS

QNews

base64stego 还不懂base64的隐写，详解15行代码带你领略

base64 隐写原理 + 破解隐写的代码

史上最完全的源码解析

代码分析

1 python 3.8.无法保存

2 这一行为后面求隐写数据提供了标尺，后面再解释

3 python 文件读写

4 隐写数据二进制字符串

5 readlines()

6 strip(“\n”)

7 offset 偏离(数字类型)

8 计算 ‘=’ 的数量

经过几个循环

输出

动手写一遍吧

分享此文：

Related Posts

测试开发进阶(十六)

对象存储 COS 全新集成媒体处理功能

贾跃亭没有回国 乐视却走远了

主播随随便便赚个百万？这才是大多数主播月收入

VirMach 便宜 VPS

QNews

熱門文章

熱門搜尋

贾跃亭没有回国乐视却走远了