首页
注册
登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请
登录
V2EX
›
able826
›
全部回复第 1 页 / 共 1 页
回复总数
1
2023-07-03 12:26:31 +08:00
回复了
TrLi
创建的主题
›
求职
›
想搬防火墙的砖
[岗位职责]
1.参与及主导网络爬虫采集规则的编写,负责分布式爬虫系统和数据采集的规划、架构、设计、开发、维护;
2.制定爬虫策略和反爬虫规则,提升数据抓取的效率和质
3.负责 http 端及 app 端的数据抓取和爬取链路优化;
4.对抓取数据进行清洗、整理、入库,进行数据处理及可视化开发工作;
1.2 年以上实际的爬虫项目经验;
2.熟练掌握 Python/JAVA 等编程语言,熟悉掌握各类爬虫框架;
3.熟悉 HTML /JavaScript/CSS/Xpath/Ajax/XML 等 web 技术,熟练掌握 HttpClient/WebDriver/splash 等工具; 4.熟悉 Linux 系统,熟悉 Mysq|、Redis 等数据库,熟悉 Internet 基本协议(如 TCP/IP ,HTTP 等) ;
5.能够解决封账号、封 IP 采集等问题,解决数据抓取、信息抽取等问题,构建完善的网络信息收集平台;
6.有数据加工、数据挖掘相关经验者优先;
v:ty1603589998
关于
·
帮助文档
·
博客
·
API
·
FAQ
·
实用小工具
·
4446 人在线
最高记录 6679
·
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 9ms ·
UTC 04:05
·
PVG 12:05
·
LAX 20:05
·
JFK 23:05
Developed with
CodeLauncher
♥ Do have faith in what you're doing.