V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
edis0n0
V2EX  ›  程序员

6.6 亿条数据, EF Core 框架有办法自动分表存储吗?

  •  
  •   edis0n0 · 2022-08-16 22:39:42 +08:00 · 1267 次点击
    这是一个创建于 830 天前的主题,其中的信息可能已经有所发展或是发生改变。
    产品大致是用户添加关注的关键词,我们每隔一段时间从一部分预设平台抓取后提供给用户下载保存。用户只能看到自己创建的需要关注的数据(用户间不共享,因为我们的场景多个用户关注相同数据概率极低,搜索只需要字段全字匹配),后台可以根据一些字段(抓取时间范围,关键词(全字匹配),行业分类(全字匹配),抓取记录 ID 范围等)进行筛选。网站目前已经抓取了 6.6 亿条数据,单表存储,目前翻页查询非常缓慢(第一页耗时 20ms ,越往后翻页越慢),想问问有什么办法自动分表存储吗?(最新的 100 万条左右数据的访问频率远高于旧数据)

    技术栈是 ASP.NET Core + Entity Framework Core 。因为搜索都只需要全字匹配,应该用不上 ES 吧?
    edis0n0
        1
    edis0n0  
    OP
       2022-08-16 22:54:29 +08:00
    感觉有一些细节没描述清楚,补充一下。前后台都只有筛选(抓取时间范围,关键词(全字匹配),行业分类(全字匹配),抓取记录 ID 范围等)和批量导出功能,不需要搜索功能。同一个关键词最多累计只会有几百条结果,单个用户有可能关注上万个关键词。
    tqyq88
        2
    tqyq88  
       2022-08-16 23:32:16 +08:00
    上 es 省事,keyword type 也不会分词
    hez2010
        3
    hez2010  
       2022-08-16 23:54:03 +08:00
    siaronwang
        4
    siaronwang  
       2022-08-17 16:52:20 +08:00
    redis search
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2743 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 06:34 · PVG 14:34 · LAX 22:34 · JFK 01:34
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.