V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
cctvsmg
V2EX  ›  问与答

怎么处理一段gbk、utf-8混合编码的字符串

  •  
  •   cctvsmg · Nov 18, 2013 · 4589 views
    This topic created in 4549 days ago, the information mentioned may be changed or developed.
    情况是这样的:
    读一个网页返回内容是json
    里面大部分是gbk少部分是乱码
    这个乱码部分是utf-8编码

    如果按照gbk ignore解码
    最后会出现有的 json的 ' 被吃掉
    例如:

    'php': '浗锛屽彜鏃', -------> 'php':'xxxxxx,

    右边的 ' 于是就消失了
    于是json就无法加载
    3 replies    1970-01-01 08:00:00 +08:00
    plprapper
        1
    plprapper  
       Nov 19, 2013   ❤️ 1
    搞成这样是防止别人程序来解析吗。。。
    SoloCompany
        2
    SoloCompany  
       Nov 19, 2013   ❤️ 1
    大哥你应该庆幸没有包含 BIG5 字符,否则你就等死吧,因为单引号是可以奇葩的合法出现在 BIG5 编码空间内的。对于现在所面临的情况,很简单,你只要使用 ISO-8859-1 编码来处理 JSON 就 OK 了,当然,转码神马的还得自己来
    cctvsmg
        3
    cctvsmg  
    OP
       Nov 19, 2013
    @SoloCompany
    @plprapper

    无语凝咽 ╮(╯▽╰)╭
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2711 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 58ms · UTC 13:14 · PVG 21:14 · LAX 06:14 · JFK 09:14
    ♥ Do have faith in what you're doing.