1
superrichman 2022-09-21 12:33:43 +08:00 via Android 2
首先考虑刑法
|
2
azev OP @superrichman 给你一个赞
|
3
kera0a 2022-09-21 12:43:52 +08:00
不是海量数据+海量代理 IP ,没必要考虑并发问题。
我爬过的大站点都有频率限制,小站点扛不住并发,基本没条件去高并发爬。 |
4
herozzm 2022-09-21 12:56:31 +08:00
首先考虑的是 ip 库,爬虫很容易被封 ip 的
|
5
picone 2022-09-21 13:05:26 +08:00
看瓶颈在哪。如果爬取的数据没有时效性,慢慢爬就行了
|
6
xiao109 2022-09-21 13:26:11 +08:00
首先考虑可以爬,像 mvnrepository.com 这种站点你连第一步都展开不了
|
7
gumupaier 2022-09-21 17:28:09 +08:00
首先考虑如何进去
|
8
lyang 2022-09-21 17:30:08 +08:00
我看刑
|
9
gezimonkey 2022-09-21 17:32:36 +08:00
首先考虑不被抓
|
10
IvanLi127 2022-09-21 17:44:59 +08:00
首先考虑如何不影响对方业务,避免变成攻击行为。。。。
|
11
abc0123xyz 2022-09-22 09:17:37 +08:00
考虑蹬缝纫机
|