V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 外包信息请发到 /go/outsourcing 节点。
• 不要把相同的信息发到不同的节点
lishugo
V2EX  ›  酷工作

[北京]知名券商寻找数据攻城狮

  •  
  •   lishugo · 2014-08-20 11:29:04 +08:00 · 2274 次点击
    这是一个创建于 3748 天前的主题,其中的信息可能已经有所发展或是发生改变。
    职位描述:

    1、 参与核心爬虫系统架构设计、数据库设计;
    2、 参与各种核心搜索策略、算法、数据聚类、重组的设计与开发;
    3、 熟悉搜索引擎/spider原理,对互联网页面的抓取质量负责;
    4、 通过大数据的方式来做金融行业分析,参与数据分析及模型建立。

    职位要求:

    1、 2年以上Python、Ruby开发经验,熟悉常用的信息抓取策略和数据重组算法,熟悉正则表达式;
    2、 精通信息抓取和整合技术,从结构化的和非结构化的数据中获取信息,掌握正则表达式;
    3、 精通与搜索和个性化相关的机器学习算法,分类和提取摘要,精通主流分词算法;
    4、 熟悉大规模网页爬取,深度网页爬取,熟悉Nutch、Lucene、Heritrix、Solr、Sphinx等工具优先考虑;
    5、 熟悉搜索引擎的工作原理,对seo有较为深刻的理解;
    6、熟悉分布式计算或高性能并行计算原理者优先;
    7、有数据挖掘、机器学习相关经历者优先。

    加入我们请将简历发送至[email protected],在邮件中标明申请职位并注明你是从V2EX上看到该招聘信息的。
    3 条回复    2014-08-22 17:13:08 +08:00
    nooper
        1
    nooper  
       2014-08-20 22:47:53 +08:00
    是做量化吗?还是做文本数据挖掘。
    有一个在里面做的师兄。。。
    lishugo
        2
    lishugo  
    OP
       2014-08-22 15:20:02 +08:00
    @nooper 初期做数据挖掘,量化这块别的团队在做,之后会涉及到。
    nooper
        3
    nooper  
       2014-08-22 17:13:08 +08:00
    @lishugo 看来不是最核心的啊。最近最近我研究了一套方法,可以做到20%左右的月收益率。哈哈。这个有人要吗。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   911 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 21:50 · PVG 05:50 · LAX 13:50 · JFK 16:50
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.