UnicodeEncodeError: 'gbk' codec can't encode character '\xe3' in position 6: illegal multibyte sequence
就类似这样的
他说是不能encode使用gbk,你改成utf-8去encode就好了
windows的操作系统下,新生产的文件默认编码都为ANSI(GBK)。 如果你先将网上爬下来的html源码(进行爬取和译码时所用的编码方式默认为utf-8)存到文件(此时生成文件的编码格式为GBK),然后再读取该文件进行解析就会出现这样的问题。 具体的解决方案,百度一下就会有
Sign in to make a reply
永远短毛
UnicodeEncodeError: 'gbk' codec can't encode character '\xe3' in position 6: illegal multibyte sequence
就类似这样的