1
shintendo 2020-11-09 11:03:29 +08:00
然后查了一下发型两个字的字符编码完全不同
-------- 字符编码贴一下呗 |
2
KuroNekoFan 2020-11-09 11:10:10 +08:00
utf8-bom?
|
3
opengps 2020-11-09 11:11:23 +08:00 via Android
从 word 里换个字体试试?
|
4
firhome OP @shintendo [⻓] 和 [长] 就这两个字,第一个字 win7 里显示 方块,第二个字 是我打的正常。我不确定这样直接回复 出来还对不对。
|
5
CloudnuY 2020-11-09 11:45:35 +08:00 1
@firhome #4 这两个字不是一个字,第一个是 [中日韩字根简体中文长] unicode 编号 U+2ED3,第二个是 [中日韩象形文字长] unicode 编号 U+957F
|
7
hahastudio 2020-11-09 11:47:18 +08:00
你别说还真不一样
'⻓' 0x2ed3 在中日韩汉字部首补充里 '长' 0x957f 在中日韩统一表意文字列表里 通常打出来的都是 0x957f |
8
yiXu 2020-11-09 11:47:45 +08:00
确实不一样,前者是 \u2ed3,后者是 \u957f
|
9
yiXu 2020-11-09 11:49:11 +08:00
页面显示编码支持就行,如果不支持,那就没办法,只能转换到支持的编码吧
|
10
liyang5945 2020-11-09 11:50:28 +08:00
刚才在调试工具里试了下:
'长'.charCodeAt(0) ==>38271 '⻓'.charCodeAt(0)==>11987 就是字符编码不一样呗,猜测可能是繁体字符 ? |
13
hahastudio 2020-11-09 12:00:38 +08:00
也许要修改一下 Windows 的 Region ?
|
15
Curtion 2020-11-09 12:12:23 +08:00
查了一下,这俩的编码来自:中日韩汉字部首补充和中日韩统一表意文字,估计是不同的机构定义的?
|
17
lxk11153 2020-11-09 12:25:57 +08:00
https://en.wiktionary.org/wiki/%E9%95%BF
> U+957F, 长 > CJK UNIFIED IDEOGRAPH-957F > U+2ED3, ⻓ > CJK RADICAL C-SIMPLIFIED LONG 你说的"你好"没看到。 |
19
yiXu 2020-11-09 12:31:09 +08:00
|
20
imn1 2020-11-09 12:33:22 +08:00
CJK Radicals Supplement Range: 2e80 ~ 2eff (这范围也就 128 个字符)
主要是汉字的偏旁部首,有少量简单汉字,但也是作为汉字的“部分”来看待的 这些字符一般需要特殊方式输入,不是平常打字打出来的 写段代码识别一下就行了 而后面说的“字型”、“你好”那些,应该就是 GBK 和 utf-8 的区别 |
21
nutting 2020-11-12 18:03:55 +08:00
客户是日本人吧
|