1
davepkxxx 2013-05-08 17:14:01 +08:00
对
|
2
swulling 2013-05-08 17:22:19 +08:00 1
Google Unicode,第一行,点进去,
Unicode字符平面映射 主条目:Unicode字符平面映射 |
3
swulling 2013-05-08 17:24:19 +08:00
|
4
xesique 2013-05-08 17:29:37 +08:00
可能会比较困难,尤其对于单个字符。
例如: 汉字在中文、日语、韩文里面共享(CJK)。 类似于[é]这样的字符在很多欧洲国家使用。 就算最简单的 A-Z 也在很多国家的语言中有。 参考: http://jrgraphix.net/research/unicode_blocks.php |
5
kenneth OP |
6
xesique 2013-05-08 17:39:02 +08:00
|
7
glasslion 2013-05-08 17:40:49 +08:00
大体上可以的,但日韩字符中有很多来源于汉字的的字符,它们的unicode码是一样的。瑞典文和德文也有类似的情况
|
8
luikore 2013-05-08 17:48:05 +08:00
语言和文字不是一回事, 文字和字符不是一回事, 多种文字可能会用到同一个字符的
猜编码+语言可以用 icu |
9
efi 2013-05-10 15:20:36 +08:00
http://www.unicode.org/reports/tr24/ [Data24] Scripts.txt -> http://www.unicode.org/Public/UNIDATA/Scripts.txt
2E80..2E99 ; Han # So [26] CJK RADICAL REPEAT..CJK RADICAL RAP ... 2F800..2FA1D ; Han # Lo [542] CJK COMPATIBILITY IDEOGRAPH-2F800..CJK COMPATIBILITY IDEOGRAPH-2FA1D # Total code points: 75963 |