Discuss / Python / 一种是英文表示的 ,一种是数字表示的Ӓ,这两种字符都可以通过Parser解析出来。

一种是英文表示的 ,一种是数字表示的Ӓ,这两种字符都可以通过Parser解析出来。

Topic source

月弦Clapton

#1 Created at ... [Delete] [Delete and Lock User]

特殊字符 ,为什么我不能通过Parser解析出来呢?

UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 5: illegal multibyte sequence

win7系统

廖雪峰

#2 Created at ... [Delete] [Delete and Lock User]

页面编码问题,跟parser没关系

页面编码问题要怎么解决呢? 我使用的win7在解析时也遇到了这个问题……

廖雪峰

#4 Created at ... [Delete] [Delete and Lock User]

先检查http的响应有没有Content-Type: text/html;charset=utf-8

再检查html的内容有没有<meta charset="utf-8" />

如果上面都检测不出编码,只能靠猜了:

https://pypi.python.org/pypi/chardet


  • 1

Reply