1
wlsnx 2016-03-31 10:19:20 +08:00
头信息是网站返回给你的, html 的 head 里面应该也有编码。
|
2
omg21 OP @wlsnx 两个网站的页面文件里都有编码信息,但用 info()取的信息里有一个没有,我就是这里不明白,明明网页文件里有的,为什么信息里没有。
V2EX 好像没法贴图啊,能贴图就直观些了。 |
3
omg21 OP @wlsnx 而且我现在就需要判断头信息里的文字编码,因为如果不判断出来,就没法用正则表达式啊。我知道你的意思是从页面文件里取,但是在没有得到编码前,没办法转码啊,没法转码就没法用正则表达式,没法用下则表达式就取不出来页面。。。
|
4
wlsnx 2016-03-31 19:53:54 +08:00
头信息是网站返回给你的,甚至可以连 Content-Type 这一行都没有。获取不到编码的话,你可以按顺序尝试常用编码。
|