Discuss / Python / 文章中举例用的中文Unicode编码是不是不太对呀

文章中举例用的中文Unicode编码是不是不太对呀

Topic source
中 01001110 00101101

我最近在弄C/C++ Split生僻字的处理,然后了解到汉字的第二个字节开头应该都固定为“1”才对,但是举例中的Unicode第二个字节开头为0,廖老师可以稍微说一下么?谢谢

另外我自己看到汉字在内存中的十六进制为0xd6d0,翻译为二进制应该是11000110 11000000

廖雪峰

#3 Created at ... [Delete] [Delete and Lock User]

先确定编码是什么,再查看十六进制

>>> hex(ord('中'))
'0x4e2d'
>>> '中'.encode('gbk')
b'\xd6\xd0'

  • 1

Reply