需要做一个类似功能的机器人客服, 现在的需求比较简单,我这有一串问答列表。只要能根据关键字回复相应的答案就行。 所以现在怎么搞,找个 nlp 服务提供商把挨个问题的关键字提取出来?再放到数据库里做匹配?
本来上午花了几个钟头找合适的云服务提供商的,奈何提供的服务远大于目前的需求。试用次数不多,过量就得付费试用了,感觉成本太高。
1
qcloud 2016-03-22 15:23:13 +08:00 via iPhone
图灵机器人
|
2
qcloud 2016-03-22 15:25:25 +08:00 via iPhone
|
3
lcj2class 2016-03-22 16:09:07 +08:00 via iPhone
可以用 es 呀
|
4
Wenwei 2016-03-22 16:13:53 +08:00
可以用 elasticsearch 搭个搜索引擎啊。
|
5
jugelizi 2016-03-22 16:14:12 +08:00
那不就是全文检索类似的嘛 分词去查权重高的就解决了啊
|
7
menc 2016-03-22 16:46:25 +08:00 1
@domty
自己用一些简单的 NLP 方法来做,分词配上 TF-IDF ,或者手动修改下 idf 提升下权值。 或者自己做一个 reinforcement learning 的框架你自己多试几次就好了。 如果不想尝试机器学习方法,推荐用哈工大的 ltp ,有 python wrapper , pip install pyltp ,下载他们放在百度网盘里的训练好的模型大概 2G ,就可以自己来做 NER , POS 等等内容了 |
8
domty OP @menc
我是尽量避免使用机器学习类的东西,因为我手头的数据样本只有不到 20 条问答,加起来不到 1000 字的水平。 像上机器学习模型或者楼上连分布式的全文搜索引擎都出来了,觉得这样搞有点大炮打蚊子的感觉。 我个人的思路是给问题做分词提取关键词然后加权,然后往数据库一放做关键字检索取权值最大的做答案回复就好了。但是两个关键的问题就是怎么分词和怎么给关键字权级。 |
9
menc 2016-03-22 17:07:42 +08:00 1
|
10
murmur 2016-03-22 17:12:23 +08:00
其实最简单的就是一个 lucene 配置一下分词机制去一下停用词 就能用了
|
11
821579877 2018-09-25 19:07:22 +08:00 via iPhone
不知道楼主最后做了没...我最近也想做个类似的呢,不知道楼主有没有啥方案可以分享一下
|