lunaticus7

lunaticus7

V2EX member #19840, joined on 2012-04-24 00:23:46 +08:00
Per lunaticus7's settings, the topics list is hidden
Deals info, including closed deals, is not hidden
lunaticus7's recent replies
Sep 9, 2022
Replied to a topic by Guesser Python py 有什么好用的数据分析工具
试试 Prometheus?
可以试试 Taylor's LBV

---

红玉波特酒: Ruby Port

---

年份波特方差很大水太深,不太懂。不过如果只是想要个生日酒的话,看价钱合适就买呗
Feb 6, 2022
Replied to a topic by knowckx Python 请教一个 Python 浮点数的小问题
https://docs.python.org/3/library/decimal.html
想要精确小数的话可以用 decimal
`但是从 DB 把数据拿到内存就需要 7 秒` 是指取 20000 * 250 向量?
特征向量为什么要存 mangoDB 嘛,这点量也没多少,直接塞内存,精度可以转成 np.float32 甚至 np.float16,能省很多内存,这些精度做检索够用

解决了了从数据库读特征向量的问题后,就可以优化检索计算了

大方向就是分级检索:先用低运算量低精度的 metirc (句向量的话直接 cosine 就行)快速检索出一个较大的候选集,然后在候选集内部再用正常的高精度低速 metirc 得出最终结果


懒得折腾可以直接上 fb 家的 faiss

PS.你什么算法啊,20w 数据相似度居然要算 2s ?
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5175 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 11ms · UTC 05:59 · PVG 13:59 · LAX 22:59 · JFK 01:59
♥ Do have faith in what you're doing.