目前试了三个,分别是 pinyin, xpinyin, pypinyin,但都有同一个问题,会把"桔子"转换成"jiezi", 理想的结果不应该是"juzi"么?
1
sandtears Dec 4, 2013 “橘”(jú)是现代汉语规范字,“桔”(jié)也是现代汉语规范字,当“桔”(jié)读(jú) 时,是“橘”jú的俗字,也就是通常所说的手头字。
“桔”本只有一个读音,jié 。“桔”和“橘”是完全不同的两个字,“桔”也不是“橘”的简化字,所以将“橘”写成“桔”是错误的。 |
2
xujialiang Dec 4, 2013 via Android
多音字确实很难处理,我们是遇到一个,特殊处理一个
|
3
iqav Dec 4, 2013
咋你的头像和我的这么像?
|
4
wptree Dec 4, 2013
多音字。用“橘子”
|
5
nrfe57d Dec 4, 2013
mark
|
6
lululau Dec 4, 2013
处理多音字的话比较麻烦,CPAN 上的 Lingua::Han::PinYin 对 “桔” 字是转成 "ju" 的
|
7
efi Dec 4, 2013
朝阳
同行 |
8
ericls Dec 4, 2013 via Android
对多音字的处理确实很麻烦啊 。。
|
9
dallaslu Dec 4, 2013
海水朝朝朝朝朝朝朝落
hai shui chao zhao zhao chao zhao chao zhao luo 浮云长长长长长长长消 fu yun zhang chang chang zhang chang zhang chang xiao |
10
Crossin Dec 4, 2013
仅靠规则来解决多音字问题比较困难吧。试试看换个思路,比如在原有基础上增加用户修正的功能
|
11
ooh Dec 4, 2013
感觉这个要搞定多音字太过繁琐,分词+词库
|
13
KiseXu Dec 4, 2013
拼音库,只要测试下“音乐”这个词的拼音就知道这个库水准怎么样了
|
14
xoxo Dec 4, 2013
|
15
yakczh Dec 4, 2013
重庆 转换出来是zhongqing
|
16
vibbow Dec 4, 2013
|
17
NemoAlex Dec 4, 2013
|
19
txlty Dec 4, 2013
http://py.kdd.cc/ (广告弹窗关了就好)
国内草根站长作品,多音字识别很完善。不过是产品而不是类库。 |
20
Ricepig Dec 4, 2013
确实很难处理
比如说前段时间比较著名的Shaanxi(陕西)和Shanxi(山西) |