tf2
V2EX  ›  微信

“微信的开发人员根本就不懂该怎么储存数据”

  •  
  •   tf2 · 4h 3m ago · 1074 views
    15 replies    2026-06-30 21:12:25 +08:00
    cpstar
        1
    cpstar  
       3h 58m ago
    用 grep 是我没有想到的,思路很清奇。。。。

    但是把文本拼接为上下文,然后按照 RAG 的逻辑向量化,好像。。。我不知道,只是突发奇想
    xtreme1
        2
    xtreme1  
       3h 49m ago
    如果真这样实现, 被标题这样喷的次数应该远多于现状..
    rpman
        3
    rpman  
       3h 46m ago
    都很抽象,不知道如何喷起
    wudaye
        4
    wudaye  
       3h 42m ago
    虽然但是,至少现在微信的聊天记录搜索不会像 telegram 一样狗屎
    changnet
        5
    changnet  
       3h 41m ago
    用 grep 是不太行,因为 grep 是纯文本匹配,精度较低。比如你想搜索某个群的聊天信息,会 grep 出其他群的,然后又需要一大堆机制去排除,而且还要做各种按规则删除就麻烦。况且在手机上 grep 并没有服务器那么高性能。

    但微信占的空间和其他聊天软件相比确实离谱,肯定是可以优化的
    tf2
        6
    tf2  
    OP
       3h 16m ago
    @changnet 你不会用 grep 。。。。
    zhywang
        7
    zhywang  
       3h 12m ago
    @cpstar 用户又不需要语义搜索,向量化没意义
    yidinghe
        8
    yidinghe  
    PRO
       3h 10m ago
    微信占空间的又不是文本,所以不要纠结文本。
    june4
        9
    june4  
       1h 48m ago
    @changnet 神 tm 全文扫精度低,可以说是精度最强最灵活。另外都用纯文本文件了,明显是群和个人 1 对 1 都要分文件存,否则删除没法做。
    xiaoshancom
        10
    xiaoshancom  
       1h 46m ago via Android
    曾经有人说 正则很简单
    GyroZeppeli13
        11
    GyroZeppeli13  
       1h 38m ago
    @wudaye 老黄历了,telegram 几个礼拜前终于把这块功能完善了。
    wy315700
        12
    wy315700  
       1h 20m ago via iPhone
    你们大概是没见过纯文本记录几十 G 的
    我从 2015 年到现在的微信记录都留着

    时不时要回去查的
    est
        13
    est  
       18 mins ago
    @wy315700 wiki 百科都不如你聊得多。
    Y25tIGxpdmlk
        14
    Y25tIGxpdmlk  
       9 mins ago
    这人是天才?
    daysv
        15
    daysv  
       2 mins ago
    想了想,也不是不行
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3216 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 57ms · UTC 13:14 · PVG 21:14 · LAX 06:14 · JFK 09:14
    ♥ Do have faith in what you're doing.