我想采集这个网站 https://shop.lululemon.com/p/men-pants/ABC-Pant-Skinny/_/prod9260236?color=43731&sz=28 的产品信息
查看源码,发现这是个 nextjs 网站,在产品详情页,点击切换颜色、尺寸,没有发起 ajax 请求对应的 sku 信息,所以他的信息是首次渲染就加载进来了,源码搜索关键词发现数据在__NEXT_DATA__,但是我打印出来这个 json 发现没有可读性,没办法提取出来。
我想问的是,有没有可能可以从这个数据结构里提取到有用的产品信息?
1
FightPig 2022-06-09 22:05:39 +08:00
__NEXT_DATA__里的不就是 json 么?
|
2
laravel OP 算了,还是用我的老办法,模拟点击
|
3
bigfei 2022-06-10 00:09:05 +08:00
https://shop.lululemon.com/api/p/men-pants/ABC-Skinny-Pant-Warp-32/_/prod10030187
直接访问 API 即可,后台用的 graphql |