诸位大牛 我刚刚学python遇到个百思不得其解的问题,我想爬豆瓣的一些图片,并下载到e:/tu 目录中,用的 re, urllib 两个库,程序我认真检查就是不知道问题出在哪, 太毁信心了,能否帮我看下?拜谢!
ps: 程序能够打印出所有图片的地址,问题应是在下载那,我应该如何修改呢?
#coding = utf-8
import re
import urllib
orin_html= urllib.urlopen("http://www.douban.com/photos/album/138010643/?start=0").read()
imgreg = re.compile(r'img.\..*jpg')
imglist = re.findall(imgreg,orin_html)
'''
需要说明的是,一直到这里都没有问题, 能够打印每张图片的链接
'''
x = 0
for i in imglist:
urllib.urlretrieve(i,'e:/tu/%s.jpg' % x)
x = x + 1
ps: 程序能够打印出所有图片的地址,问题应是在下载那,我应该如何修改呢?
#coding = utf-8
import re
import urllib
orin_html= urllib.urlopen("http://www.douban.com/photos/album/138010643/?start=0").read()
imgreg = re.compile(r'img.\..*jpg')
imglist = re.findall(imgreg,orin_html)
'''
需要说明的是,一直到这里都没有问题, 能够打印每张图片的链接
'''
x = 0
for i in imglist:
urllib.urlretrieve(i,'e:/tu/%s.jpg' % x)
x = x + 1