爱意满满的作品展示区。
heimoshuiyu

用视觉大语言模型检索表情包

  •  3
     
  •   heimoshuiyu · Aug 17, 2025 · 1954 views
    This topic created in 283 days ago, the information mentioned may be changed or developed.

    脑子一抽想出来的 idea 。好奇大模型对各种 meme 能理解到什么地步。后面加入语义检索就变成有用的 meme 检索工具了。前端是 vibe coding 的,后端是 Rust 手写的,VLM 提示词是瞎写的,钱包余额是烧光了的。

    欢迎各位玩玩,第一次搜索时加载 VectorChord 的缓存可能有点慢。

    https://vlmeme.aquarium39.moe

    11 replies    2025-08-19 00:16:34 +08:00
    est
        1
    est  
       Aug 18, 2025
    好帖没人回啊。
    heimoshuiyu
        2
    heimoshuiyu  
    OP
       Aug 18, 2025
    @est 可能是睡觉了吧,明天周一上班摸鱼应该就有人了(希望(
    beyondex
        3
    beyondex  
       Aug 18, 2025   ❤️ 1
    好想法
    5261
        4
    5261  
       Aug 18, 2025
    @heimoshuiyu 这个模型是提供表情图片还是图片对应的文字喂给大型模呢? 选视觉学习模式还是文本学习模型呢
    heimoshuiyu
        5
    heimoshuiyu  
    OP
       Aug 18, 2025
    @5261 提供的是图片,图片喂给视觉大语言模型 VLM 模型,模型再吐出文字。然后用 embedding 模型做文字的语义搜索。每个图片下方还有使用 CLIP 和 embedding 在视觉和文字语义上推荐的相似图片
    5261
        6
    5261  
       Aug 18, 2025   ❤️ 1
    @heimoshuiyu 好的,准备用大量靓妹图片做模型,然后根据关键字搜索那啥
    heimoshuiyu
        7
    heimoshuiyu  
    OP
       Aug 18, 2025
    @5261 牛的
    beyondex
        8
    beyondex  
       Aug 18, 2025
    话说 VectorChord 说他是 pgvector 的继任者,是指的它自己组织目录下的那个 pgvector.rs https://github.com/tensorchord/pgvecto.rs
    还是 这个 pgvector https://github.com/pgvector/pgvector

    这俩名字重名了。。。
    beyondex
        9
    beyondex  
       Aug 18, 2025
    @5261 有现成别人做好的产品,图片本地计算不需要云:归海桌面&图片搜索
    5261
        10
    5261  
       Aug 18, 2025
    heimoshuiyu
        11
    heimoshuiyu  
    OP
       Aug 19, 2025
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   4151 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 44ms · UTC 00:58 · PVG 08:58 · LAX 17:58 · JFK 20:58
    ♥ Do have faith in what you're doing.