文章中举例用的中文Unicode编码是不是不太对呀

Discuss / Python / 文章中举例用的中文Unicode编码是不是不太对呀

Back

Topic source

#1 Created at ... [Delete] [Delete and Lock User]

中 01001110 00101101

我最近在弄C/C++ Split生僻字的处理，然后了解到汉字的第二个字节开头应该都固定为“1”才对，但是举例中的Unicode第二个字节开头为0，廖老师可以稍微说一下么？谢谢

#2 Created at ... [Delete] [Delete and Lock User]

另外我自己看到汉字中在内存中的十六进制为0xd6d0，翻译为二进制应该是11000110 11000000

#3 Created at ... [Delete] [Delete and Lock User]

先确定编码是什么，再查看十六进制

>>> hex(ord('中'))
'0x4e2d'
>>> '中'.encode('gbk')
b'\xd6\xd0'