举例, www.baidu.com ,那就分为搜索网站, www.jd.com ,分为电商网站,以此类推。。。。。。
1
cdlnls 2016-10-30 19:10:33 +08:00 via Android
目测只能手动
机器不大可能知道你的那个域名是什么网站 而且不确定你的那几十万个域名是不是可以访问的 |
2
zachlhb 2016-10-30 19:11:50 +08:00 via Android
这个没办法吧,除非有网址库
|
3
knightdf 2016-10-30 19:13:31 +08:00
这叫根据域名?难道这不叫根据内容?
|
4
puyo 2016-10-30 19:39:10 +08:00
可不可以根据域名对应网站的 description 或者 keywords 来做分类
|
5
murmur 2016-10-30 19:50:35 +08:00
只根据域名无解 还有多少个数字网站呢
|
6
huage 2016-10-30 20:20:19 +08:00
没有办法
|
7
dsg001 2016-10-30 20:25:52 +08:00
采集域名 alexa 数据, alexa 有分类
|
8
CRight 2016-10-30 20:32:54 +08:00
3721 能做到吧...
|
9
bazingaterry 2016-10-30 20:49:56 +08:00
只能机器学习了?
|
10
huluhulu 2016-10-30 21:32:51 +08:00
采集这些域名的主页,
如果可以,采集主页上的链接页面的内容。 然后 TF-IDF 算法简单算一下,分成几类之后,就可以看看每一类大概是什么内容了。数据挖掘自动化分类的范畴。 |
11
alittletrain 2016-10-30 22:08:28 +08:00
|
12
lhx2008 2016-10-30 22:13:35 +08:00
@alittletrain 事实上,还真有一个这样搞事的网站 baidu.wf
|
13
alittletrain 2016-10-30 22:23:34 +08:00
@lhx2008 世界之大,无。。。。
|