python 2 年业余经验。
1. requests + pyquery + 多线程 + sqlite3 感觉使用比较顺利。
2. 多进程虽然不了解原理但是能用,反正我之前试着抓的时候没发现多进程的必要性。
3. 不会任务队列但是假如客户有需求也可以去学。
4. 除 sqlite3 外其他类型的数据库存数据感觉不太好交付吧?假如客户有需求,反正都是用 SQLAlchemy,基本也能应付。
5. 经验:跑通过 Lofter,知乎,百度招聘,大众点评的抓取。
原因:
一方面是想找个兼职锻炼下,另外主要原因如下面这个链接:
https://www.v2ex.com/t/367796#reply35