V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
paloalto
V2EX  ›  问与答

请问这是什么编码?

  •  
  •   paloalto · 2014-03-06 11:26:32 +08:00 · 2869 次点击
    这是一个创建于 3917 天前的主题,其中的信息可能已经有所发展或是发生改变。
    http://www.tol.edu.cn/uploads/files/

    无意间发现的这个地址,试了 gbk 和 utf8 都是乱码。

    另外,这个目录应该可以公开访问吗?
    10 条回复    1970-01-01 08:00:00 +08:00
    lululau
        1
    lululau  
       2014-03-06 11:55:09 +08:00   ❤️ 2
    UTF-8编码的,被当做 GBK 转过码了

    curl -s 'http://www.tol.edu.cn/uploads/files/' | iconv -c -t GBK
    paloalto
        2
    paloalto  
    OP
       2014-03-06 14:09:04 +08:00
    @lululau 似乎是失败了,不花时间折腾了。

    lululau
        3
    lululau  
       2014-03-06 14:37:00 +08:00
    @paloalto 你这已经是成功了啊,看不到那个“会口安排”了吗,只是原本UTF-8编码的数据被当做GBK做过一次解码,因此有些信息已经丢失了,这样的丢失是不能恢复的
    Mutoo
        4
    Mutoo  
       2014-03-06 14:54:25 +08:00
    GB18030 效果会更好一些,但是还是丢了几个字符。
    passluo
        5
    passluo  
       2014-03-06 14:56:38 +08:00
    别纠结什么编码了。
    这个网站是我们大二的时候做的,我都不知道什么编码了。
    求不乱搞,服务器在教育部北京机房,小心被查水表谢谢。
    passluo
        6
    passluo  
       2014-03-06 14:59:22 +08:00
    不过按照常识,应该是UTF-8的,至于为什么会这样。。。就不知道了额。。
    11138
        7
    11138  
       2014-03-06 14:59:23 +08:00
    Apache没配置好造成的。
    IndexOptions Charset=UTF-8
    这样就正常了。
    paloalto
        8
    paloalto  
    OP
       2014-03-06 16:11:07 +08:00
    @passluo 哈哈哈哈原来如此!
    passluo
        9
    passluo  
       2014-03-06 16:41:30 +08:00
    应该是 @11138 说的这个问题,当时我们自己配置部署的服务器没这种情况,而且这个目录也是被封了的,不应该被访问到。。。。。应该是他们重新部署的时候没注意这些了。。。
    passluo
        10
    passluo  
       2014-03-06 16:44:59 +08:00
    刚才问了一下以前的哥们儿们,说可能是文件名md5过。。。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3185 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 40ms · UTC 13:35 · PVG 21:35 · LAX 05:35 · JFK 08:35
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.