Base64:是一种基于 64 个可打印字符来表示数据的方法,由于 2^6=64,每 6 个比特为1个单元,对应某个可打印字符。包括小写字母a-z、大写字母A-Z、数字0-9、符号"+"、"/"一共64个字符的字符集,另加一个“=”,共65个字符。任何内容都可以转换成这个64字符集中的字符组成的字符串,这个转换过程叫做base64编码。
Base64不是加密算法,只是一种编码方式,数据从一种形式转换为另一种形式进行表示、传输、存储。把原来字节组成的数据按每6位分组,2^6=64,6位比特位计算出数值后,对应出可打印字符。
例如,在电子邮件的传输中,Base64 可以用来将二进制的字节序列(如附件),编码成基于Base64的ASCII 字节序列进行传输;将一些体积不大的图片 编码Base64 后,直接内嵌到网页源码里;
Base64是一种将 byte数组编码成的字符串只包含ASCII基础字符,用于解决各系统以及传输协议中不兼容的问题而生的。
Base64 编码,分为 4 步:
- 将原始数据每3个字节Byte作为1组,每个字节Byte是8个位bit,所以一共是 24个位bit;
- 将24个位bit以6位为一组,共分为4组,每组6个bit;
- 在重新分好的每组前面加补00,将6位bit补全8个位bi;
- 最后原始数据的3个字节已经变成4个字节了;编码后的每个字节对应63个字符串的1个;
如“Man”字符串Base64编码后就是“TWFu”
字符串“Man”编码
步骤1:01001101 01100001 01101110(原始数据3个字节共24位)
步骤2:010011 010110 000101 101110(以6位1组,划成4组)
步骤3:00010011 00010110 00000101 00101110(每组前面加00,组成一个完整字节)
步骤4:查表,对应TWFu
有时会在Base64字符末尾会看到“=”号,1个或2个。Base64编码过程是3个字符一组的进行,如果原文长度不是3的倍数怎么办呢? 例如我们的原文为Ma,它不够3个字节,那么只能在编码后的字符串中补“=”。缺一个字符补一个,缺两个补两个。