李土进 电话:18718548159 邮箱: [email protected] 求职岗位:爬虫开发 个人经历:一年开发经验
实习经历
2017.06-至今 python 爬虫 广州诚益信息科技有限公司 广州市
负责用 scrapy 框架抓取医院网页医院,城市,医生等可公开数据,储存到数据库(MySQL)。 项目遇到较大难点:比较容易识别爬虫,采用封 ip 等形式反爬虫,解决方案:采用多 ip,定时更新 ip,每次更换请求 ip 以及代理浏览器应对反爬虫。 另一个难点:页面多为点击触发请求才显示数据,普通请求获取不到数据,每次 post 请求带上获取 到的参数解决。 涉及技术:MySQL,python,scrapy 框架 技能爱好
专业技能 : 1.熟悉 python,flaskweb 框架 2.熟悉 scrapy 框架,爬虫原理 ,phantomjs,selenium 爬虫辅助工具 3.了解 HTML,CSS,JavaScript,jQuery 4.了解 http 协议,Mysql 数据库 5.了解 linux(半年使用) 作品展示
网址: https://github.com/mistery-li/hospital 爬虫