qq.com的编码到底是那种？ - V2EX

Home Sign Up Sign In

This topic created in 5327 days ago, the information mentioned may be changed or developed.

html源代码里写的是charset=gb2312，我用python的chinese编码不能正常解码，但用gbk可以。

而且我看到http的返回头
Content-Type: text/html; charset=GB2312

也是标的2312。

所以页面里是不是用了gb2312的超集？这样的话难道浏览器会自动用gbk解码？

4 replies • 1970-01-01 08:00:00 +08:00

1

jakepg

Dec 28, 2011

python 使用 chardet 来检测编码。当然，在你的例子里面有点得不偿失。嗯，使用 requests 来 get http://www.qq.com 页面毫无压力。requests 值得你尝试。

2

keakon

Dec 28, 2011

gbk本来就是gb2312的超集

3

bullock

Dec 28, 2011

正在看这个，或许对你有用
http://ued.taobao.com/blog/2011/08/26/encode-war/

4

args

OP

Dec 28, 2011

@bullock
这个赞

About · Help · Advertise · Blog · API · FAQ · Solana · 2100 Online Highest 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 27ms · UTC 16:12 · PVG 00:12 · LAX 09:12 · JFK 12:12
♥ Do have faith in what you're doing.