b'\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8') 输入上述指令能得到结果:'中文' 那为什么decode()在这里是对前三个字符进行解码,而不是对第一个字节或前两个字节或前四个字节进行解码呢?或者换句话说,是否存在对前两个字节能解码的情况?
因为utf-8是变长编码,可能对1/2/3/4字节进行解码,只是大部分中文是3字节而已
用gbk总是1/2字节,2字节是中文,1字节是英文
明白了!多谢解答!!
Sign in to make a reply
Hfer_酸酸_乳川
b'\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8') 输入上述指令能得到结果:'中文' 那为什么decode()在这里是对前三个字符进行解码,而不是对第一个字节或前两个字节或前四个字节进行解码呢?或者换句话说,是否存在对前两个字节能解码的情况?