python 版本: 2.7 本人能力:非程序员,有一点点喜欢 python ,想折腾一些数据采集之类的,以便今后转运营助理或者运营,方便数据记录、分析。 环境模拟:想要采集皮鞋第一页、第二页全部产品的标题、图片、价格等前端展现的内容,可能详情页也需要用代码做截图处理,可能需要采集正文和评价。 问题:淘宝里的 json 是非正常的,由于技术问题,先用 sub 替换了 jsonp232(),也不能正常解析。求前辈折腾一下。
python 不用处理就能正常 dumps 、 load 能解析的 淘宝 json
1
fy 2017-03-17 15:19:07 +08:00
这个是 JSONP 的,不光是最前面有额外字符,最后面也有字符
|
2
aegisho 2017-03-17 15:25:54 +08:00
ls +1
地址里的 callback=jsonp232 直接改为 callback= 不就是 json 了 |
3
xingshu1990 OP 谢谢上面两个大神 我测试一下
|
4
burnex 2017-03-17 15:27:31 +08:00
JSONP
|
5
Jaylee 2017-03-17 16:24:03 +08:00 1
|
6
fhefh 2017-03-17 16:42:33 +08:00
|
7
xingshu1990 OP 不一一答谢了,各位层主谢谢,搞定了。
|