关于decode()的一点小疑问

Discuss / Python / 关于decode()的一点小疑问

Back

Topic source

#1 Created at ... [Delete] [Delete and Lock User]

b'\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8') 输入上述指令能得到结果：'中文' 那为什么decode()在这里是对前三个字符进行解码，而不是对第一个字节或前两个字节或前四个字节进行解码呢？或者换句话说，是否存在对前两个字节能解码的情况？

#2 Created at ... [Delete] [Delete and Lock User]

因为utf-8是变长编码，可能对1/2/3/4字节进行解码，只是大部分中文是3字节而已

用gbk总是1/2字节，2字节是中文，1字节是英文

#3 Created at ... [Delete] [Delete and Lock User]

明白了！多谢解答！！