V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
dersu
V2EX  ›  外包

爬虫及数据处理系统外包

  •  
  •   dersu · 2016-10-17 22:52:33 +08:00 · 774 次点击
    这是一个创建于 2960 天前的主题,其中的信息可能已经有所发展或是发生改变。
    项目是为客户现有企业分析系统建设一个新的数据渠道。
    python 技术栈,基于 scrapy 框架。
    抓取网站的数据,并对指定数据进行提取和跟踪。
    同时提供接口服务,实现爬虫的管理和数据输出。

    项目是我们和合作公司一起做的,但合作公司上周单方面终止合同,临时退出了项目。
    团队内部商量后,觉得目前团队的工作量已经很饱和了,所以想找一个靠谱的团队或者个人把这块整体外包。

    系统爬虫部分比较简单,最基本的爬虫开发即可满足需求;接口服务对并发、性能要求都不高,实现需求即可。
    难点在于目标数据的鉴别,跟踪和提取,可能需要较复杂的算法来实现对特征量的识别和处理。
    我们自己团队评估过,数据处理上,有一两个功能点我们目前没想出特别好的处理方式,其他的尽管能实现,但也挺麻烦。
    所以,如果只是擅长基本的爬虫开发,请不要浪费时间来谈了,最好是有很丰富的数据处理经验。

    具体需求涉及商业机密,联系后另行说明。
    我们这边是公司,可以私人交易也可以签订正式商务合同,也可以接受在任意你选择的平台上交易。
    有兴趣的请发邮件至 heqiliao2 # outlook.com ,抱歉工作环境没法用 qq。
    我会把核心需求在邮件尽可能简单的说一下,如果确定能做,那我在把正式的需求协议发给你,然后商量一下价格和工期。
    谢谢
    4 条回复    2016-10-20 15:29:25 +08:00
    songmeiya
        1
    songmeiya  
       2016-10-19 11:14:21 +08:00
    给您发了邮件没有收到回复,可以加我微信: shixianteam3,来聊聊。
    dersu
        2
    dersu  
    OP
       2016-10-19 23:39:30 +08:00
    @songmeiya 前面有三个人发来的联系邮件都被莫名的自动放到垃圾箱里了,我今天中午都已经回复了。现在你应该已经收到邮件了吧
    songmeiya
        3
    songmeiya  
       2016-10-20 15:29:00 +08:00
    然而并没有收到回复呀……
    songmeiya
        4
    songmeiya  
       2016-10-20 15:29:25 +08:00
    @dersu 真的没有收到回复 ,呜呜呜呜
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3743 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 01:00 · PVG 09:00 · LAX 17:00 · JFK 20:00
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.