一种是英文表示的 ,一种是数字表示的Ӓ,这两种字符都可以通过Parser解析出来。
Topic source先检查http的响应有没有Content-Type: text/html;charset=utf-8
再检查html的内容有没有<meta charset="utf-8" />
如果上面都检测不出编码,只能靠猜了:
- 1
先检查http的响应有没有Content-Type: text/html;charset=utf-8
再检查html的内容有没有<meta charset="utf-8" />
如果上面都检测不出编码,只能靠猜了:
月弦Clapton
特殊字符 ,为什么我不能通过Parser解析出来呢?
UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 5: illegal multibyte sequence
win7系统