1
args 2011-11-11 16:05:34 +08:00
这个肯定事先作者没考虑到。直接暴力把中英文分开了。其实我的一个分词程序就是这么做的。。。。
|
2
dreamersdw 2011-11-11 16:06:42 +08:00
mmseg 是靠内置的单词表加启发算法实现中文分词的。
你可以先试试向 mmseg/data/words.dic 文件添加需要的词汇。要是还有问题的话,考虑自己修改源码吧。 |