1
xsseroot 2016 年 6 月 24 日
将商圈的 url 和 name 做个 hash ,写到 redis 中每次判断下不就行了。
|
2
jatesun 2016 年 6 月 24 日 via iPhone
可以放到线程安全的 hash 表里
|
3
chendajun 2016 年 6 月 24 日
把抓过的 URL md5 一下,写到 redis , mongo 等。每来一个 URL 就与库里比较一下
|
4
hwsdien 2016 年 6 月 24 日
把采集过的 url 放进 redis, 每次采集判断一下。
|
6
practicer 2016 年 6 月 29 日
尽管让重复的 item 插进数据库,活干完后 SELECT DUMPS 掉
|