V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
bobobo80
V2EX  ›  程序员

不同源商品名匹配应该如何处理?

  •  
  •   bobobo80 · Aug 8, 2018 · 2286 views
    This topic created in 2832 days ago, the information mentioned may be changed or developed.

    问题:

    假设同一类商品,在 A 网站叫 XXX-abc-123,在 B 网站叫 XXX-123-abcd,叫法上有微小差别,从 A 和 B 抓取到的数据汇总到一起,怎么把对应一致的商品匹配起来呢?

    举例:

    • 比如同一款笔记本电脑,在 A 网站叫'Apple MacBook Pro 13.3 英寸笔记本电脑 银色 配备 Touch Bar 2018 新款(四核八代 i5 8G 256G 固态硬盘)',在 B 网站叫'Apple/苹果 13 英寸 2018 MacBook Pro 触控栏和触控 ID 2.3GHz 处理器 256GB 存储容量'
    • 或者同一款冰箱,在 A 网站叫'海尔( Haier ) 452 升风冷无霜对开门冰箱 90 度开门 66.5cm 纤薄机身 低温净味 双温双控 BCD-452WDPF',在 B 网站叫'海尔 风冷无霜-对开门冰箱 452 升 BCD-452'
    • 或者同一款车,在 A 网站叫'大众 宝来 2019 款 1.5L 自动舒适型',在 B 网站叫'一汽大众 宝来 1.5L AT 舒适型 2019 款'

    像这种不同来源,同一种商品,但是名字中的组成、顺序、包含关系、个别细节有所不同的情况,一般是使用什么算法把对应关系进行匹配的?求指点。

    4 replies    2018-08-13 09:39:54 +08:00
    yunye
        1
    yunye  
       Aug 9, 2018 via Android
    品牌型号不知道吗
    ryd994
        2
    ryd994  
       Aug 9, 2018 via Android
    没有太好的办法
    Google shopping 也没完全解决这个问题
    coeo91
        3
    coeo91  
       Aug 9, 2018 via Android
    专门类的一个一个指定?京东第三方就是全展示。
    bobobo80
        4
    bobobo80  
    OP
       Aug 13, 2018
    @coeo91 手工一个个指定吗?那工作量好大吧。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   6033 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 87ms · UTC 06:06 · PVG 14:06 · LAX 23:06 · JFK 02:06
    ♥ Do have faith in what you're doing.