请问老师,怎么获取一个中文字符在unicode编码下占多少字节呢?
比如,‘中’在utf-8下,用len('中'.encode('utf-8))显示为3,在unicode下,如果要返回字节长度,该怎么写呢?
utf-8
unicode
unicode在内存中总是两字节,无论是中文还是英文:
'\u4e2d'
一个unicode字符相当于一个两字节的int,返回unicode的字节长度没有意义,字符个数才有意义
Sign in to make a reply
奥利根
请问老师,怎么获取一个中文字符在unicode编码下占多少字节呢?
比如,‘中’在
utf-8
下,用len('中'.encode('utf-8))显示为3,在unicode
下,如果要返回字节长度,该怎么写呢?