推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
zzxworld
V2EX  ›  Python

有没有靠谱的汉字转拼音模块

  •  
  •   zzxworld · Dec 4, 2013 · 7121 views
    This topic created in 4560 days ago, the information mentioned may be changed or developed.
    目前试了三个,分别是 pinyin, xpinyin, pypinyin,但都有同一个问题,会把"桔子"转换成"jiezi", 理想的结果不应该是"juzi"么?
    21 replies    1970-01-01 08:00:00 +08:00
    sandtears
        1
    sandtears  
       Dec 4, 2013   ❤️ 3
    “橘”(jú)是现代汉语规范字,“桔”(jié)也是现代汉语规范字,当“桔”(jié)读(jú) 时,是“橘”jú的俗字,也就是通常所说的手头字。
    “桔”本只有一个读音,jié 。“桔”和“橘”是完全不同的两个字,“桔”也不是“橘”的简化字,所以将“橘”写成“桔”是错误的。
    xujialiang
        2
    xujialiang  
       Dec 4, 2013 via Android
    多音字确实很难处理,我们是遇到一个,特殊处理一个
    iqav
        3
    iqav  
       Dec 4, 2013
    咋你的头像和我的这么像?
    wptree
        4
    wptree  
       Dec 4, 2013
    多音字。用“橘子”
    nrfe57d
        5
    nrfe57d  
       Dec 4, 2013
    mark
    lululau
        6
    lululau  
       Dec 4, 2013
    处理多音字的话比较麻烦,CPAN 上的 Lingua::Han::PinYin 对 “桔” 字是转成 "ju" 的
    efi
        7
    efi  
       Dec 4, 2013
    朝阳
    同行
    ericls
        8
    ericls  
       Dec 4, 2013 via Android
    对多音字的处理确实很麻烦啊 。。
    dallaslu
        9
    dallaslu  
       Dec 4, 2013
    海水朝朝朝朝朝朝朝落
    hai shui chao zhao zhao chao zhao chao zhao luo
    浮云长长长长长长长消
    fu yun zhang chang chang zhang chang zhang chang xiao
    Crossin
        10
    Crossin  
       Dec 4, 2013
    仅靠规则来解决多音字问题比较困难吧。试试看换个思路,比如在原有基础上增加用户修正的功能
    ooh
        11
    ooh  
       Dec 4, 2013
    感觉这个要搞定多音字太过繁琐,分词+词库
    Clude
        12
    Clude  
       Dec 4, 2013
    @ooh “南京市长江大桥”这种词直接放词库里吗?
    KiseXu
        13
    KiseXu  
       Dec 4, 2013
    拼音库,只要测试下“音乐”这个词的拼音就知道这个库水准怎么样了
    xoxo
        14
    xoxo  
       Dec 4, 2013
    http://fiddle.jshell.net/A7TLw/

    送给楼主一个JS的转换库
    yakczh
        15
    yakczh  
       Dec 4, 2013
    重庆 转换出来是zhongqing
    vibbow
        16
    vibbow  
       Dec 4, 2013
    NemoAlex
        17
    NemoAlex  
       Dec 4, 2013
    @xoxo JS 的话这个弱爆了,连常用字都不全
    推荐 https://github.com/hotoo/pinyin.js
    还有更强大的 node 版本
    ooh
        18
    ooh  
       Dec 4, 2013
    @Clude 所以说太繁琐,不用词库还有其他办法能搞定?
    txlty
        19
    txlty  
       Dec 4, 2013
    http://py.kdd.cc/ (广告弹窗关了就好)
    国内草根站长作品,多音字识别很完善。不过是产品而不是类库。
    Ricepig
        20
    Ricepig  
       Dec 4, 2013
    确实很难处理

    比如说前段时间比较著名的Shaanxi(陕西)和Shanxi(山西)
    vmebeh
        21
    vmebeh  
       Dec 4, 2013
    @Clude 想起了 “南京市长 江大桥 欢迎你”
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2669 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 104ms · UTC 12:18 · PVG 20:18 · LAX 05:18 · JFK 08:18
    ♥ Do have faith in what you're doing.