ps : 这俩还在更新吗..
pg 的中文分词需求感觉蛮大的啊。哪里有好的社区可以求指导咩
1
ptsa 2021-06-28 23:26:31 +08:00
更新不频繁。 应该都能用
|
3
MinQ 2021-06-29 10:38:56 +08:00
https://ai.tencent.com/ailab/nlp/en/embedding.html
可以把这里面的词抽出来作为词典,质量还是很高的 |
5
MinQ 2021-06-29 15:14:24 +08:00
@dzdh 不需要,下载下来是一个训练好的文件,里面是词+对应的词向量的形式
读到内存里(可能需要至少 16G 以上的内存),然后把词库提取出来给 jieba 用 https://www.biaodianfu.com/tencent-word-embedding.html |