通过Chrome查看页面源代码,我有看到charset=utf-8,页面应是utf-8编码的。
系统是Windows8.1
通过python的urllib2的urlopen下载html,拿到本地的是乱码。
而Chrome另存为到本地则可以成功读取(另存为时格式也是utf-8)
已经尝试了encode+decode,gbk, gb2312似乎都不起效。
网页地址:
http://wiki.52poke.com/wiki/%E5%A6%99%E8%9B%99%E7%A7%8D%E5%AD%90
还请各位高手点拨一二。
系统是Windows8.1
通过python的urllib2的urlopen下载html,拿到本地的是乱码。
而Chrome另存为到本地则可以成功读取(另存为时格式也是utf-8)
已经尝试了encode+decode,gbk, gb2312似乎都不起效。
网页地址:
http://wiki.52poke.com/wiki/%E5%A6%99%E8%9B%99%E7%A7%8D%E5%AD%90
还请各位高手点拨一二。