Base64 是一种十分流行的编码方式,仅仅使用 64 个字符加等号(=) 就可以以文本的形式表示所有的二进制数据了,因为它能够把二进制格式通过编码转换成可见字符,所有我们就可以通过的把二进制格式比如图片,文件等通过 base64 编码然后通过文本的形式共享出去,是不是很神奇呀。
编码流程
- 把输入的数据转换成 二进制的形式
- 每 3 个 8bit 为一组拆分为 4 个 6bit 8*3=6*4=24
- 拆分后的 6bit 的高位补两个 0 组成新的 8bit
- 把新的 8bit 转化为 10进制,然后查表得到最终的字符串
- 如果最后不够 3 个 8bit,分两种情况
- 有 2 个 8bit 差 1 个 8bit,由于 8*2=6+6+4=16,可以拆出来 2 个 6bit 和 一个不完整的 4bit,base64 编码规定给不足 6bit 的差几个 bit 补几个0,4bit 低位补 2 个0,组成了 6bit,由于一共需要 4个 6bit,前面一共产生了 3 个,还差 1 个,base64 编码规定 差几个 6bit 补几个 '=',这里差一个,所以在最后补一个 =,这也是为什么有时候能看到 base64 最后以等号结束
- 有 1 个 8bit 差 2 个 8bit,由于 8=6+2,可以拆出来 1 个 6bit 和一个不完整的 2bit,先给 2bit 低位补 4 个 0 组成 6bit,然后还差 2 个 6bit 组成 4 个 6bit,因此在最后添两个 =
编码表
base64的编码表如下:
下面来举例说明:
有一个字符串”abcd”
a b c d
ASCII: 0x61 0x62 0x63 0x64
8bit: 01100001 01100010 01100011 0110 0100
6bit: 011000 010110 001001 100011 011001 000000 = =
十进制: 24 22 9 35 25 0
查码表得: Y W J j Z A = =
最终结果:YWJjZA==
看这个动画演示吧: