1
eric Jul 23, 2012 NLTK 的 word_tokenize 就能很方便的实现。
http://nltk.org/ |
2
stackpop OP @eric 的确好强大,就是我想要的东西。之前打算用C++ 写,后来朋友建议用python,代码简洁得多,果然py强大~难怪国外好多大学CS第一门编程课改成python了,呵呵
|
3
fanzheng Jul 24, 2012
如果只是出现次数的话用split然后counter()嘛,官方模块文档里面的counter()
|
4
from0tohero Jul 26, 2012 NLTK最好没有之一~
|