因为 Unicode 的范围是 0x0000 至 0x10FFFF,但 char 只有两个字节,所以 java 的 char 类型只使用的 Unicode 的 0x0000 至 0xFFFF 范围吗?
1
est Feb 10, 2020
surrogate pair 了解一下。 -XX:+UseCompressedStrings 了解一下
|
2
amiwrong123 OP @est
这个 surrogate pair 是 utf-16 里的东西,所以也有可能两个 char 代表一个字符的呗。 UseCompressedStrings 百度了下,它就是让 jvm 认为每个字符都是 ascii,也都是单字节的呗。 |
3
zhuge415 Feb 10, 2020
超过范围的,编译就会报错
|
4
kx5d62Jn1J9MjoXP Feb 10, 2020 对
char: The char data type is a single 16-bit Unicode character. It has a minimum value of '\u0000' (or 0) and a maximum value of '\uffff' (or 65,535 inclusive). 超出范围的无法用 char 表示, 只能用 String |
5
palmers Feb 10, 2020 |
6
spadger Feb 11, 2020
看起来还是用 utf8 比较好。
|