场景是这样的:
爬虫程序会周期性收录一些 item , item 有 title 这一属性;
另有一堆 object ,每个 object 均有若干 keyword ;
object 通过自己的 keyword 来对 item 的 title 进行搜索,以获取到匹配自己的 item ;
当用户访问 object 时,就进行一次搜索,以返回 item 结果。但这样没法给 item 和 object 建立双向关联,即只能通过 object 的 keyword 来搜索 items ,不能通过 item 反向找回 objects 。
(item 和 object 是多对多关系,并不是一一对应的)
新建立一个关系表是肯定的,问题是,如何给它们建立关联呢?
一个想法是,周期性去轮 object 集合,逐个 object 进行处理,搜索出匹配的 items ,然后将其写进关系表。但是这样不太环保,大部分 object 是不需要更新的,只有少部分 object 需要增删 item 关联。
那么,有没有什么办法,能直接根据 item 的 title 来反向匹配出 object 呢?这样只需在爬虫收录新 item 后,对这堆新 item 建立新关联就行了。
或者有其他的办法能高效环保地建立起关联?(难道要去动用机器学习相关技能……)
爬虫程序会周期性收录一些 item , item 有 title 这一属性;
另有一堆 object ,每个 object 均有若干 keyword ;
object 通过自己的 keyword 来对 item 的 title 进行搜索,以获取到匹配自己的 item ;
当用户访问 object 时,就进行一次搜索,以返回 item 结果。但这样没法给 item 和 object 建立双向关联,即只能通过 object 的 keyword 来搜索 items ,不能通过 item 反向找回 objects 。
(item 和 object 是多对多关系,并不是一一对应的)
新建立一个关系表是肯定的,问题是,如何给它们建立关联呢?
一个想法是,周期性去轮 object 集合,逐个 object 进行处理,搜索出匹配的 items ,然后将其写进关系表。但是这样不太环保,大部分 object 是不需要更新的,只有少部分 object 需要增删 item 关联。
那么,有没有什么办法,能直接根据 item 的 title 来反向匹配出 object 呢?这样只需在爬虫收录新 item 后,对这堆新 item 建立新关联就行了。
或者有其他的办法能高效环保地建立起关联?(难道要去动用机器学习相关技能……)