两周的时间里,造数在大家的批评与建议中获得了很大的成长,这次我们带来了全新的界面,新的功能。升级 ajax 支持组件之后,可以满足基本的数据采集任务,可以简单地抓取,识别各种主流网站的信息。
爬虫的使用需求越来越高,我们对数据采集的要求也越来越高,爬虫技术与反爬虫技术此消彼长。但是真正简单易用的云爬虫,还没有出现,我们希望可以认真做一个。也期待大家能开心地把玩我们的网站。
接下来的时间里,造数会继续飞快的改进,与大家一起思考易用爬虫的应用场景,期待能让大家感受与造数一起成长的快乐。请大家有什么需求,建议,一定要告诉我。
下面是目前的网页操作流程图,如果感觉哪里不合胃口,造数希望可以为你裁剪,为你定制,欢迎私信。
一,下面是目前造数的基本使用方法,粘贴网址到框内进行分析
二,分析的步骤
( 1 )进入分析页面以后,点选你要的数据,我们自动帮你把同类信息选中。
( 2 )如图,看到其他同类的价格也被选中,可以进一步选择其他信息。
三,规则设置之后,进入预览界面
四,进入工作台,这里可以管理你的所有任务,决定是否定时抓取,导出文件的格式等等。
目前支持 excel , xml , jason , csv 的各种导出格式,希望你能尽情玩耍。
造数团队
1
a87150 2016-11-24 03:05:06 +08:00 1
感觉好难用啊,有没有更进一步的操作。比如爬到 url 之后再抓取这个 url 里面的内容和翻页之类的。
|
2
GrahamCloud OP @a87150 翻页在设置规则里可以用,最近在优化,控制台的定制规则可以稍稍满足你现在的需求。
|
3
binux 2016-11-24 03:30:25 +08:00 1
对齐还是不对
|
4
GrahamCloud OP @binux 首页的对齐么?求问哪里
|
5
ofblyt 2016-11-24 11:26:26 +08:00 1
给的两个例子还不错
|
6
570k 2016-11-24 14:25:50 +08:00 1
注册不了 QQ 邮箱 163 邮箱 都没收到邮件
|
7
GrahamCloud OP @570k 马上解决一下。
|
8
570k 2016-11-24 15:56:51 +08:00 1
试了下 挺难用的 等下个版本吧
|
9
GrahamCloud OP @570k 感谢杭州的朋友,估计下周还会在上一些功能,现在主要收集需求。
|
10
570k 2016-11-24 16:02:58 +08:00 1
@GrahamCloud 期待
|