diaoleona's recent timeline updates
diaoleona

diaoleona

V2EX member #52685, joined on 2013-12-25 16:02:44 +08:00
diaoleona's recent replies
Aug 21, 2014
Replied to a topic by endoffight Python 求助正则表达式牛人帮忙解决一下
为何不用xpath
要求iOS方向,
却不能在移动设备上查看gmail,
不如先招个人让你们移动设备上先能看gmail?
scrapy or scrapyd
Jun 3, 2014
Replied to a topic by zrq495 求职 [求实习]暑假 + 大四
有过在线做题数据分析的经验非常好,已经把你简历转发给HR.请耐心等待
Jun 3, 2014
Replied to a topic by JackyXiong Python Python 的文档转换模块 docutils 的使用?
May 27, 2014
Replied to a topic by hao1032 Python python 如何获取一个网址的标题??
@dbow 不能同意更多
@yakczh
类似这种页的话一个parser专门把ur,商品信息等可以xpath的信息保存下来,
另外一个parser来抽取相关评论,翻页什么的不是问题,储存时候 评论 和这个商品的ID联系起来.
@yakczh
'多个页面都可能有数据,每个页面有多个数据区域的话,还不知道怎么写'
没看明白你具体问题是什么?
如果担心多个页面多个数据 区域有相同的的数据的话,把你需要的数据区域都爬下来hash一下或者放在一个专门判重redis也可以在scrapy 里的中间件加一道判重过程.
最好你发个子页面的例子给看一下
Feb 26, 2014
Replied to a topic by WeeTom 上海 上海 明道 www.mingdao.com 招 iOS 工程师
来黑你们公司的么??
看你怎么设计了,我之前是爬到的response.url和 web content压缩一下放在一个数据库里,然后根据需求再做不同的抽取
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   867 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 15ms · UTC 21:40 · PVG 05:40 · LAX 14:40 · JFK 17:40
♥ Do have faith in what you're doing.