import sys
default_encoding = 'utf-8'
if sys.getdefaultencoding() != default_encoding:
    reload(sys)
    sys.setdefaultencoding(default_encoding)

import requests
r = requests.get("http://court.gov.cn/zgcpwsw/bt/xjscjsbtdseszjrmfy/wlmqkqrmfy/ms/201503/t20150313_6914630.htm")
print r.text.encode('utf-8')

这样输出的中文为乱码，试了网上的各种办法都没用。求问各位大大应该怎么解决。。。

utf

sys

import

11 replies • 2015-04-07 00:22:11 +08:00

yangqi

Mar 17, 2015

国内很多网站都是gbk或者gb2312的编码

icedx

Mar 18, 2015

你为什么要print 呢

lixia625

Mar 18, 2015

`import urllib
r = urllib.urlopen("http://court.gov.cn/zgcpwsw/bt/xjscjsbtdseszjrmfy/wlmqkqrmfy/ms/201503/t20150313_6914630.htm")
print r.read().encode('utf-8')
`
亲测不乱码

lerry

Mar 18, 2015

这样
#!/usr/bin/python
# coding: utf-8

import requests
r = requests.get("http://court.gov.cn/zgcpwsw/bt/xjscjsbtdseszjrmfy/wlmqkqrmfy/ms/201503/t20150313_6914630.htm")
print r.content

或者

#!/usr/bin/python
# coding: utf-8

import requests
r = requests.get("http://court.gov.cn/zgcpwsw/bt/xjscjsbtdseszjrmfy/wlmqkqrmfy/ms/201503/t20150313_6914630.htm")
r.encoding = "utf-8"
print r.text.encode('utf-8')

r.content 是网页原始编码，r.text 是decode后的内容，这个网页是utf-8编码，可以直接print

r.encoding = "utf-8" 手工设置编码，这样text会使用你设置的编码decode

另外，楼主开头几行改变默认编码是不建议的写法