V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
MySQL 5.5 Community Server
MySQL 5.6 Community Server
Percona Configuration Wizard
XtraBackup 搭建主从复制
Great Sites on MySQL
Percona
MySQL Performance Blog
Severalnines
推荐管理工具
Sequel Pro
phpMyAdmin
推荐书目
MySQL Cookbook
MySQL 相关项目
MariaDB
Drizzle
参考文档
http://mysql-python.sourceforge.net/MySQLdb.html
InneRs
V2EX  ›  MySQL

如何让 MySQL 5.7 支持 6 字节的 UTF-8 字符?

  •  
  •   InneRs · 2016-04-28 03:54:08 +08:00 · 2940 次点击
    这是一个创建于 3132 天前的主题,其中的信息可能已经有所发展或是发生改变。

    我最近在录入人民日报的文章,里面有一些极其生僻的人名、地名。比如越南有个地方叫做北𣴓,这个𣴓字是 CJK 扩展 B 区里面的, UTF-8 编码有六个字节,但是目前 MySQL 的 utf8mb4 最多就支持四个字节的。这问题有没有解决方法?

    大家无视我吧,我发现𣴓这个字就是四个字节的,是我数据库设置的问题...

    yeyeye
        1
    yeyeye  
       2016-04-28 08:43:23 +08:00
    6 字节…… 这也太占空间了吧……
    SoloCompany
        2
    SoloCompany  
       2016-04-28 22:49:13 +08:00
    这明明是你的问题,至少到现在的 Unicode 标准为止,字符数还没有超过十万, 4 字节的 Utf-8 有 21 个有效 bit 位 (11110xxx 10xxxxxx 10xxxxxx 10xxxxxx),至少可以容纳两百万个字符,还早着呢
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2972 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 13:37 · PVG 21:37 · LAX 05:37 · JFK 08:37
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.