Discuss / Python / 你们有没有遇到gbk的转码问题?

你们有没有遇到gbk的转码问题?

Topic source

永远短毛

#1 Created at ... [Delete] [Delete and Lock User]

UnicodeEncodeError: 'gbk' codec can't encode character '\xe3' in position 6: illegal multibyte sequence

就类似这样的

丶志灬勇

#2 Created at ... [Delete] [Delete and Lock User]

他说是不能encode使用gbk,你改成utf-8去encode就好了

泛色海岸

#3 Created at ... [Delete] [Delete and Lock User]

windows的操作系统下,新生产的文件默认编码都为ANSI(GBK)。 如果你先将网上爬下来的html源码(进行爬取和译码时所用的编码方式默认为utf-8)存到文件(此时生成文件的编码格式为GBK),然后再读取该文件进行解析就会出现这样的问题。 具体的解决方案,百度一下就会有


  • 1

Reply