V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐关注
Meteor
JSLint - a JavaScript code quality tool
jsFiddle
D3.js
WebStorm
推荐书目
JavaScript 权威指南第 5 版
Closure: The Definitive Guide
wdhwg001
V2EX  ›  JavaScript

诡异的 Chrome 编码问题…?是我见识短吗…

  •  
  •   wdhwg001 · 2017-01-21 12:56:33 +08:00 · 3209 次点击
    这是一个创建于 2862 天前的主题,其中的信息可能已经有所发展或是发生改变。

    最近遇到了一个头大的编码问题,出现在 Chrome 改变页面编码至非 UTF8 的时候。

    当前的 Chrome 已经不支持随便改页面编码了,所以要么安装插件,要么需要在本地调试,把编码设定到非 UTF8 ,比如 GB18030 。

    var foo=new Image();
    foo.src = 'https://mdn.mozillademos.org/files/7693/catfront.png 你';
    console.log(foo.src);
    

    以上这段返回的结果是https://mdn.mozillademos.org/files/7693/catfront.png%20%E4%BD%A0

    …嗯,非常正常。

    var foo=new Image();
    foo.src = 'https://mdn.mozillademos.org/files/7693/catfront.png?你';
    console.log(foo.src);
    

    …返回的结果是https://mdn.mozillademos.org/files/7693/catfront.png?%C4%E3

    …只多了一个问号,编码和之前完全不同了,变成了 GB18030 编码…

    所以这是什么状况… Chrome 的 Bug 还是有标准要求这样处理?

    有些不能理解,顺便 IE 是不会对这个字符串做 escape 的,实际提交了怎样的请求还有待观察…

    6 条回复    2017-01-22 19:52:21 +08:00
    wdhwg001
        1
    wdhwg001  
    OP
       2017-01-21 13:11:18 +08:00
    Edge 对不问号的反应是`https://mdn.mozillademos.org///files/7693/catfront.png?ä½ 
    https://mdn.mozillademos.org//files/7693/catfront.png%20ä½%C2%A0`

    对带问号的反应是`https://mdn.mozillademos.org///files/7693/catfront.png?ä½ `

    有些莫名其妙了…其中“ä½ ”用 escape()转码后刚好是%E4%BD%A0 …
    wdhwg001
        2
    wdhwg001  
    OP
       2017-01-21 13:13:48 +08:00
    被 V2EX 的自动处理坑了一波, Edge 对不带问号的反应是`%20ä½%C2%A0`…%C2 出现的莫名其妙。
    flyingghost
        3
    flyingghost  
       2017-01-22 11:37:23 +08:00
    1 ,网站如果使用 UTF8 的话,第二段代码也会使用 UTF-8 。
    2 ,网站如果使用 GBK 的话, url 部分依然是 UTF-8 (???), query 部分会被编码为 GBK 。
    3 , chrome/firefox 表现一致。

    问号部分和我预期不符啊。。。等高人解释问号部分。。。
    p2227
        4
    p2227  
       2017-01-22 18:07:25 +08:00
    把编码设定到非 UTF8
    是指 HTML 文件包含 `<meta name="Content-Type" content="text/html;charset=gbk">`还是说文件的实际存储代码是 gbk ?
    wdhwg001
        5
    wdhwg001  
    OP
       2017-01-22 19:49:05 +08:00 via iPhone
    @p2227 二者均有。事实上单纯在浏览器中改变编码并使用控制台测试也可以触发这个问题。
    wdhwg001
        6
    wdhwg001  
    OP
       2017-01-22 19:52:21 +08:00 via iPhone
    简单翻了一下 URI 的 RFC ,似乎没有提到“ query 的编码由当前页面决定, path 统一编码为 UTF-8 ”这样的描述。
    不过也许是我看的不仔细,或者这件事是由 w3c 一类的规定的…?
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3331 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 10:38 · PVG 18:38 · LAX 02:38 · JFK 05:38
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.