This topic created in 2881 days ago, the information mentioned may be changed or developed.
1、参与爬虫系统的架构设计与开发;
2、负责指定网站页面的抓取和提取处理;
3、负责 API 的开发、设计和维护;
1、熟悉 python 编程语言, http 协议,html,xpath 等
2、对数据较为敏感,能对数据的正确性及完整性负责
3、有处理常见爬虫问题的经验者优先
4、熟悉分布式系统原理,理解集群开发和高可用相关实践;