Discuss / Python / 关于decode()的一点小疑问

关于decode()的一点小疑问

Topic source

b'\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8') 输入上述指令能得到结果:'中文' 那为什么decode()在这里是对前三个字符进行解码,而不是对第一个字节或前两个字节或前四个字节进行解码呢?或者换句话说,是否存在对前两个字节能解码的情况?

廖雪峰

#2 Created at ... [Delete] [Delete and Lock User]

因为utf-8是变长编码,可能对1/2/3/4字节进行解码,只是大部分中文是3字节而已

用gbk总是1/2字节,2字节是中文,1字节是英文

明白了!多谢解答!!


  • 1

Reply