Unicode转换为UTF-8的规则

Discuss / Python / Unicode转换为UTF-8的规则

Back

Topic source

#1 Created at ... [Delete] [Delete and Lock User]

UTF-8 的编码规则很简单，只有二条：

1）对于单字节的符号，字节的第一位设为0，后面7位为这个符号的 Unicode 码。因此对于英语字母，UTF-8 编码和 ASCII 码是相同的。

2）对于n字节的符号（n > 1），第一个字节的前n位都设为1，第n + 1位设为0，后面字节的前两位一律设为10。剩下的没有提及的二进制位，全部为这个符号的 Unicode 码。

中

ASCII：x

Unicode：01001110 00101101

UTF-8：11100100 10111000 10101101

#2 Created at ... [Delete] [Delete and Lock User]

#3 Created at ... [Delete] [Delete and Lock User]

您的解释太清楚了，正好解答我心中疑问，谢谢！