1
erictang66 2013-10-12 16:50:26 +08:00
你现在可以做的就是比如看一下python的标准库,先从基本的爬虫开始写,慢慢来,再有如果是想写web的话,可以先去了解一下tornado,django以及webpy这些常用的web框架等等,理论上来说,你以前学过其他的编程语言的话,学一门新的语言并不是很难,我也是自学的python,都是零零碎碎的时间学的
|
2
flynngao 2013-10-12 16:57:16 +08:00
写网站?
|
3
vmebeh 2013-10-12 17:11:45 +08:00
和楼主一样先爬虫后博客
爬虫就和浏览器流程差不多,先下载网页,再提取需要的内容,URL都会有规律的,有分页的都可以提取到下一页/上一页的URL。 博客就复杂点,如1楼所说,最好了解一下已有的web框架,然后根据你博客准备部署的平台选一种框架,再看看那个框架的文档,你有基础很快就能写好。 |
4
moroumo 2013-10-12 20:06:10 +08:00
在写爬虫ing,也是初学。
用http://doc.scrapy.org/en/latest/index.html |
5
RIcter 2013-10-14 10:41:48 +08:00
|
6
xdyl 2013-10-14 12:10:23 +08:00
Scrapy.抓取网页入库SoEasy.
不过解析我用的是Java版的自动解析正文. Python的没试过. |
7
xdyl 2013-10-14 12:11:19 +08:00
Scrapy做爬虫解析代码的话也就是十行左右.入库也就是五行左右.赶紧写几个试试去
|
10
flowerains OP |
11
flowerains OP @RIcter
很期待你的作品 |