最近爬了一些视频链接练手,爬下来之后,发现部分链接是无效的(无法播放),于是打算筛选一遍,保留有效链接。 在筛选时,发现通过响应码或者 html 内容都无法准确判断某条链接是否有效,请问该从哪里下手进行鉴别呢?
视频链接示例: http://abc.cdn.baidu.net/upic/2017/07/28/00/BMjAxNzA3MjgwMcxNDM4MzlfMl8z.mp4
1
nnnToTnnn 2020-01-07 18:14:05 +08:00
|
2
kernelpanic 2020-01-07 18:42:38 +08:00
curl -o - -H 'Range: bytes=0-16' -sI '***.mp4' |grep 'Content-Type'|cut -d ' ' -f2
|
3
xmumiffy 2020-01-07 19:02:08 +08:00 via Android
ffmpeg 也行(
|
4
error 2020-01-07 19:09:04 +08:00 via iPhone
请求视频的 range bytes=0-1,检查 response 里的 content length
|
5
xiaoz 2020-01-07 19:10:58 +08:00 via Android
curl 只请求 header 部分,根据返回状态吗来判断。
|
6
airdge 2020-01-07 23:31:54 +08:00
requests.head(url).status_code
|