中 01001110 00101101
我最近在弄C/C++ Split生僻字的处理,然后了解到汉字的第二个字节开头应该都固定为“1”才对,但是举例中的Unicode第二个字节开头为0,廖老师可以稍微说一下么?谢谢
另外我自己看到汉字中在内存中的十六进制为0xd6d0,翻译为二进制应该是11000110 11000000
中
0xd6d0
11000110 11000000
先确定编码是什么,再查看十六进制
>>> hex(ord('中')) '0x4e2d' >>> '中'.encode('gbk') b'\xd6\xd0'
Sign in to make a reply
Orange酱酱酱
我最近在弄C/C++ Split生僻字的处理,然后了解到汉字的第二个字节开头应该都固定为“1”才对,但是举例中的Unicode第二个字节开头为0,廖老师可以稍微说一下么?谢谢