我们是一个年轻的数据科学团队,希望使用技术改变商业世界,实现数据驱动的精细化研究、运营与决策。 我们的产品正在服务国内外一流企业,包括世界最大的对冲基金、国际一线汽车品牌、快消品龙头厂商,以及时尚鞋服大牌。
我们的团队里有许多顶尖的工程师和数据科学家,来自腾讯、百度、快播、华为、BCG 和国际投资银行,毕业于海内外著名高校。
我们获得了著名真格基金和联想之星顶尖机构的投资,资金充足,处在高速发展的上升期。但我们仍然是一个小公司,你的加入仍然可以对公司的发展轨迹产生明显的影响和贡献。
我们专注于前沿技术和产品的研发,包括数据采集沉淀 /分布式处理和存储 /高性能实时运算 /数据挖掘 /自然语言处理 /数据可视化。每天的工作都充满了挑战性,一定不会无聊。
我们的团队很扁平,只有协作没有层级。我们有高度自治的工作氛围,每一个人都有充分的自主权选择更优秀的方案完成自己负责的工作。
我们主力语言是 Python、Golang 和 Javascript,技术栈包含 Cassandra、Hive、Elasticsearch、MongoDB、Pandas、Scikit-learn、Docker,以及各种自己开发维护的黑科技。我们有着浓厚的工程师文化,乐于尝试大量的开源项目,并做出贡献。
负责爬虫框架的搭建
负责爬虫技术攻坚,丰富爬虫反爬手段
在 python 爬虫方面具有丰富的经验
熟知爬虫框架,具备架构爬虫框架的能力
熟知当前各类反爬手段,并具有应对这些反爬手段的实际经验
爬虫相关工作经验两年以上
工作内容。我们专注于前沿技术和产品的研发,包括数据采集沉淀、分布式处理和存储、高性能实时运算、数据挖掘、自然语言处理、数据可视化。你可以接触到各种各样有挑战的事情
技术栈。我们主力语言是 Python、Golang 和 Javascript,技术栈包:含 Cassandra、Hive、Elasticsearch、MongoDB、Pandas、Scikit ‑ learn、Docker,以及各种自己开发维护的黑科技。我们有着浓厚的工程师文化,乐于尝试大量的开源项目,并做出贡献。你可以深入理解各种前沿技术,并在实际中运用自己的理念
技术分享
开发工业级爬虫
设计大规模数据存储方案
优化爬虫平台
技术攻坚。主要体现在网站反爬、数据存储和多个站点爬虫管理
熟悉计算机网络相关知识,并有扎实的编程基本功
很好的沟通能力和理解能力
1年及以上 Python 项目开发经验;熟悉 MySQL 等关系型数据库以及 SQL 语言,至少掌握一种 NoSQL 数据库,对存储性能优化有了解者优先;熟悉 Linux 平台环境的开发
负责公司关键词挖掘、情感分析、信息抽取、智能问答等领域的研究
优化关键词抽取、情感分析等算法,提升算法准确度
熟悉 NLP、深度学习当前热点和前沿技术,有完整的、系统的认知
熟悉 C/C++/Python/Java 中的一种语言
拥有至少一年在分词、词性标注、关键词抽取、文本分类、实体识别、信息抽取、情感分析等 NLP 领域相关开发工作经验
拥有深度学习在 NLP 领域的实操经验,并有可靠的项目落地
良好的团队合作意识和沟通能力
提供充足的时间让您打磨自己的技术,参加线上或线下比赛
提供足够的工作自主性,自我安排学习计划
提供最接近商业应用的机器学习落地机会,提升自身价值
代表公司参加各种有关机器学习的商业 Hackthon 比赛
与数据分析师一起,应用机器学习算法在需求规划、销量预测、动态定价等商业领域创造价值
定期与组内分享机器学习算法知识及应用经验
计算机或相关专业本科以上学历
对机器学习以及如何在行业内应用有浓厚的兴趣
熟悉 C/C++/Python/Java 中的一种开发语言
理解机器学习基本算法的设计思想和求解手段,如 SVM, LR, RF, Boosting 等
拥有机器学习实操经验,参加过线上比如 Kaggle、天池比赛者优先
较强的自主学习能力,良好的英语沟通能力者优先
提供充足的时间让您打磨自己的技术,参加线上或线下比赛
提供足够的工作自主性,自我安排学习计划
提供最接近商业应用的机器学习落地机会,提升自身价值
有竞争力的薪酬:工资、五险一金、年终奖、节假日福利、生日礼物等。既有情怀,又有“钱”途
合理的工作时间:我们有弹性工作时间制度,并追求使用技术去高效解决问题,不提倡加班
团队活动:每周的篮球和羽毛球运动,每周的分享会,每月的聚餐、生日会等。我们是一个有凝聚力的团队
年度体检:豪华体检,健康强壮的身体是工作的基础
零食饮料:不间断的供应丰富优质的零食饮料
年度旅游:去年第一次出国旅行,随着团队的壮大,以后能去得更远
舒适的工作环境:我们有一个漂亮的办公室,开放式的设计和十分开阔壮观的窗景
1
wzhan 2018-05-10 23:39:44 +08:00
公司是非常好的公司,但是貌似自己条件没达到啊(哭
|