V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
chjf2008
V2EX  ›  程序员

国家外观设计专利检索公共服务系统 图搜还挺准的,他们用的是什么模型来实现的?

  •  
  •   chjf2008 · 2025 年 3 月 12 日 · 1211 次点击
    这是一个创建于 318 天前的主题,其中的信息可能已经有所发展或是发生改变。

    用图片检索专利,国家外观设计专利检索公共服务系统似乎挺准的 ,只是交互体验太差,专利更新也比较慢。

    可有大佬知道 他们用什么模型来实现图片检索的,我试过 clip 和 dinov2 都达不到它这个效果。

    https://d.cnipa.gov.cn/micro-portal/#/

    4 条回复    2026-01-22 14:44:09 +08:00
    fox0001
        1
    fox0001  
       2025 年 7 月 13 日
    类似的需求,我们用 dinov2-with-registers-giant ,取 CLS Tocken 。自动识别图片主体,效果比阿里云的图像搜索还好。

    https://huggingface.co/facebook/dinov2-with-registers-giant

    不过这个模型有个硬伤,很耗 GPU 。即使把输入的图片压缩成 224x224 ,生成向量仍需要 250ms 左右。
    Suinn
        2
    Suinn  
       4 天前
    @fox0001 大佬求教,最近我也在做这个方向但是效果不是很好,除了 dino 提取特征后进行相似度比较外,还有其他优化的方向吗
    fox0001
        3
    fox0001  
       4 天前 via Android
    @Suinn #2 图像方面,我也只是入门玩家。

    一般的做法是,先从搜索图片提取“主体”,再用该“主体”去搜数据库。至于使用什么模型提取“主体”,可以试试 SAM3 ,但是该模型需要提示词或提示框。要注意,如果“主体”识别错误,结果也是错的。

    DINOv3 也发布一段时间了,效果比 dinov2-with-registers 系列要好,可以试试。DINOv3 可以支持更高分辨率,但宽和高要取 16 的倍数。

    另外,使用 DINOv3 做“微调”,也是一个方向。
    Suinn
        4
    Suinn  
       2 天前
    @fox0001 感谢,DINOv3 我前段时间也试过了,可能是我的场景类内相似度有点高,所以准确率不是特别好,我再研究研究
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2912 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 08:29 · PVG 16:29 · LAX 00:29 · JFK 03:29
    ♥ Do have faith in what you're doing.