 |
|
lunaticus7
V2EX member #19840, joined on 2012-04-24 00:23:46 +08:00
|
 |
Per lunaticus7's settings, the topics list is hidden |
Deals info, including closed deals, is not hidden
lunaticus7's recent replies
可以试试 Taylor's LBV
---
红玉波特酒: Ruby Port
---
年份波特方差很大水太深,不太懂。不过如果只是想要个生日酒的话,看价钱合适就买呗
`但是从 DB 把数据拿到内存就需要 7 秒` 是指取 20000 * 250 向量?
特征向量为什么要存 mangoDB 嘛,这点量也没多少,直接塞内存,精度可以转成 np.float32 甚至 np.float16,能省很多内存,这些精度做检索够用
解决了了从数据库读特征向量的问题后,就可以优化检索计算了
大方向就是分级检索:先用低运算量低精度的 metirc (句向量的话直接 cosine 就行)快速检索出一个较大的候选集,然后在候选集内部再用正常的高精度低速 metirc 得出最终结果
懒得折腾可以直接上 fb 家的 faiss
PS.你什么算法啊,20w 数据相似度居然要算 2s ?