有 10T+ pdf 做一套内容检索系统,以后会继续新增 pdf
1.通过关键字可以快速检索 pdf 文件内容
2.可通过账号密码登录,并上传 pdf 和检索
3.在保证上边情况下,相对低的成本。
目前想到是:
pdf 解析到 es + Elasticsearch 集群 + web 进行开发(可是 es 的集群有点小贵)
求大佬们指点下。
1.通过关键字可以快速检索 pdf 文件内容
2.可通过账号密码登录,并上传 pdf 和检索
3.在保证上边情况下,相对低的成本。
目前想到是:
pdf 解析到 es + Elasticsearch 集群 + web 进行开发(可是 es 的集群有点小贵)
求大佬们指点下。