V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
fyyz
V2EX  ›  C

用 C++17 写程序到底要用 string 还是 u32string

  •  
  •   fyyz · Nov 21, 2018 · 5062 views
    This topic created in 2726 days ago, the information mentioned may be changed or developed.
    https://en.cppreference.com/w/cpp/locale/codecvt_utf8_utf16

    看了一下这个链接,这些函数都在 C++17 里废弃了。

    所以用 C++17 写程序到底该用 string 还是 u32string ?

    个人更喜欢用 u32string,应为这样做 split 什么的更方便点。
    14 replies    2018-11-21 17:12:38 +08:00
    ipwx
        1
    ipwx  
       Nov 21, 2018
    UTF-8 基本上对 find/split/replace 是安全的。

    所以为什么不用 UTF-8 呢?
    shylockhg
        2
    shylockhg  
       Nov 21, 2018
    看需求呗,ascii---string,宽字符---xstring
    wutiantong
        3
    wutiantong  
       Nov 21, 2018   ❤️ 1
    wutiantong
        4
    wutiantong  
       Nov 21, 2018   ❤️ 1
    wutiantong
        5
    wutiantong  
       Nov 21, 2018
    实际上<codecvt>的实现情况好像一直都不太好
    fyyz
        6
    fyyz  
    OP
       Nov 21, 2018
    谢谢大家,决定只用 utf-8 了
    GeruzoniAnsasu
        7
    GeruzoniAnsasu  
       Nov 21, 2018
    同一直有这个迷惑。。。我感觉 python3 的做法其实挺好,不知道有没有类似的实现
    fyyz
        8
    fyyz  
    OP
       Nov 21, 2018
    @ipwx 对不起我还有个问题,如果我用 string 存 utf8 字符串,那我如何遍历这个字符串中的每个字符(而不是遍历字节)呢?
    htfy96
        9
    htfy96  
       Nov 21, 2018   ❤️ 1
    不要用 codecvt。以 Ascii 为主就全用 string,别的就使用 C++20 的 u8"字面量"和 std::u8string。转换自己处理,可以抄 http://llvm.org/svn/llvm-project/llvm/trunk/include/llvm/Support/ConvertUTF.h 一份。
    GeruzoniAnsasu
        10
    GeruzoniAnsasu  
       Nov 21, 2018
    看完 3# 发的文章有了新认识


    @fyyz 照文章的说法,遍历某个 code point 并不是那么有意义,更有意义的是遍历某个字素群(比如两个码点组合成的一个字),而遍历字素群的方法在几乎所有的语言上都没有官方实现,所以大概还不如自己撸一个
    fyyz
        11
    fyyz  
    OP
       Nov 21, 2018
    @GeruzoniAnsasu 感觉要遍历字素群这玩意必须要看到具体的每个字符的值,并且 if 判断才行
    GeruzoniAnsasu
        12
    GeruzoniAnsasu  
       Nov 21, 2018
    @fyyz 是这样,但看起来麻烦得要死,我大概会先不管只按 code point 划分然后查表 if 一把梭有 bug 再说
    ipwx
        13
    ipwx  
       Nov 21, 2018
    reus
        14
    reus  
       Nov 21, 2018
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5386 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 60ms · UTC 08:05 · PVG 16:05 · LAX 01:05 · JFK 04:05
    ♥ Do have faith in what you're doing.