最近偶然看到很强大的网页抓取工具 headless chrome。学习了一下,很快就写了个小网页放到网上。
很简单的功能,输入一个网址,生成手机和桌面版本的全屏截图。(支持某些不存在的站点)
放出地址, 请各位把玩把玩 http://www.91urls.com
我在想这个东西有没有往后做的可能,比如把大家生成截图的网址列出来,大家可以点赞、收藏、评论。 问题是 url 可能包罗万象,没有集中的兴趣点。
各位有什么想法,一起探讨一下,顺便帮我带点流量过来。
1
onsale Jan 16, 2018
|
2
onsale Jan 16, 2018
|
3
zhtphoenix OP @onsale 下一步可以做抓取页面内容进行分析
|
4
7654 Jan 16, 2018
用这个可以上班摸鱼哈
|
5
Sanko Jan 16, 2018 via Android
花式看 yellow pic
|
6
northisland Jan 16, 2018
@我扶奶奶过哈登
|
7
zhtphoenix OP 兄弟们太火爆了,把我服务器搞挂了。。并发时性能还有问题
|
8
zhtphoenix OP 得先优化一下并发的性能了
|
9
AlwaysBee Jan 16, 2018
不错啊,之前一直用着 Full page screen capture 这个插件
|
10
Pudge1337 Jan 16, 2018 via Android
不错,好玩!
|
11
miaomiao888 Jan 17, 2018
|
12
NUT Jan 17, 2018
ajax 这种没处理好。 都是白的
|
13
mclxly Jan 17, 2018
提个建议: 我之前想做的,是每天发送一张截图给微信,例如 jd 的产品价格页。
|
14
shapl Jan 17, 2018
怎么自己发了那么多请求???
|
15
kimown Jan 17, 2018
LZ 是依据什么判断页面已经加载完毕,然后截图的,例如页面是纯数据填充的,但由于网速,后端接口需要 10s 后才返回,那 LZ 什么时候截图呢
|
16
nine99 Jan 17, 2018
好厉害!!非常好用!!就是如果需要登入的网站是不是就用不了?
|
18
whileFalse Jan 17, 2018
看楼主的域名,果断生成了个 91p0rn 的截图。
|
19
253874 Jan 17, 2018
不错
|
20
keventseng Jan 17, 2018
这是已经崩了吗?
|
21
shenyu1996 Jan 17, 2018
使用的 puppeteer 么?后台的服务器是 linux 么,昨天我也在搞这个抓了下 b 站我账号下的动态更新,windows 下运行没问题,但是想跑在服务器上有点麻烦
|
22
julu Jan 17, 2018
体验了下,很实用
|
23
Sunrise837 Jan 17, 2018
类似 360IE 插件有个功能 保存网页为图片。
|
24
v9ex Jan 17, 2018
测试了下草榴,发现可以,服务器在香港?
https://ww4.sinaimg.cn/large/a15b4afegy1fnjgknhx3vj20dc0hs75d |
25
zhtphoenix OP @shenyu1996 是 puppeteer, 在 ubuntu 上跑的
|
26
LeungJZ Jan 17, 2018
挂了。
|
27
zhtphoenix OP @v9ex 阿里云新加坡服务器
|
28
stalon Jan 17, 2018
https://developers.google.com/web/updates/2017/04/headless-chrome
Taking screenshots To capture a screenshot of a page, use the --screenshot flag: chrome --headless --disable-gpu --screenshot https://www.chromestatus.com/ # Size of a standard letterhead. chrome --headless --disable-gpu --screenshot --window-size=1280,1696 https://www.chromestatus.com/ # Nexus 5x chrome --headless --disable-gpu --screenshot --window-size=412,732 https://www.chromestatus.com/ Running with --screenshot will produce a file named screenshot.png in the current working directory. If you're looking for full page screenshots, things are a tad more involved. There's a great blog post from David Schnurr that has you covered. Check out Using headless Chrome as an automated screenshot tool . |
29
ArchiTech Jan 17, 2018
|
30
marcomarco Jan 17, 2018
有点意思,收藏了,希望拓展出更多功能,比如一键给整站截图 手动斜眼
|
31
hydyy Jan 17, 2018
好玩好玩
|
32
jkjoke Jan 17, 2018
挺不错的
|
33
MonoLogueChi Jan 17, 2018 via Android
|
34
xuyl Jan 17, 2018
|
35
woffee Jan 17, 2018
上班呢,楼上干什么呢(斜眼笑
|
36
livc Jan 17, 2018
不错,收藏了。
|
37
nexusone Jan 17, 2018
楼主的这个很 nice 啊,但是楼上的咱就别拿黄网做测试了
|
38
zhtphoenix OP @nexusone 老实说我做了这个后,才发现了好多本来不知道的小黄网,精神食粮更丰富了,感谢兄弟们
|
39
exuxu Jan 17, 2018
什么?小黄网,哪里哪里?
|
40
wvidc Jan 17, 2018
|
41
shawn2333 Jan 18, 2018 via iPhone
需要点一下“阅读全文”的怎么搞
|
42
mydns Jan 18, 2018
|
43
pandasoda Jan 18, 2018
做的不错,就是截图的网站标题有些移位
|
44
zhtphoenix OP @pandasoda 已经 fix, 谢谢
|
45
issue Jan 18, 2018
一些建议:
1.自动补全 http:// 2.params 支持中文 3.自动加载更多时,等它加载完再截图 4.有些网站需要登录 5.屏蔽一些关键词 47xxxxx62 |
46
zhtphoenix OP @ArchiTech 赞赞赞
|
47
zhtphoenix OP @laoganbu 难得的建设性意见,谢谢
|
48
mervin24 Jan 25, 2018
检测广告法不错 加淘宝天猫上广告法检测
|
49
livc Feb 24, 2018
这么快就挂了?
|
50
xshwy Jun 16, 2019
不知道怎么刷到这条,发现现在成了瑟情网站…
|