百度贴吧云监控(功能:百度贴吧发帖频率统计以及贴吧帖子热门关键词统计) 仓库地址 https://github.com/cw1997/Tieba-Posting-Frequency demo 地址: http://t.changwei.me/tongji (搭建在 openshift 速度非常卡是服务器问题不是我代码有问题,大家轻喷) 代码是过程化编写的,没有用什么面向对象啊 MVC 啊之类的,不图优雅,图个简单。
代码使用方法: 上传所有文件到服务器上,添加 do_num.php 和 do_tongji.php 为监控项或者 cron 计划任务,每小时执行一次。导入 tongji.sql 到数据库中并且修改 conn.php 中的各项配置即可。
touxiang.php ——获取贴吧头像(服务端脚本获取可绕过贴吧的 Referer 检测,此脚本有被 DDOS 攻击的风险,如有需要可修改文件名以及在 do_xxx.php 文件中对应的 require 语句)
index.php ——首页展示
timer.class.php ——统计脚本执行时间类文件
do_num.php ——定时 fetch 发帖量数据并且存入数据库进行统计
do_tongji.php ——定时 fetch 帖子内容并且调用中文分词 API 进行分词并且存入数据库进行统计
中文分词部分调用的是 SCWS 的中文分词接口,特此感谢。
1
mornlight 2016-05-15 13:04:52 +08:00
|
4
zsx 2016-05-15 14:08:14 +08:00
我也想起了我给自己写的自动签到和删广告器(虽然是靠关键词识别)……
|
5
crab 2016-05-15 14:14:22 +08:00
能提示点关于 IP 那个哪里获取吗。
|
8
rootliang 2016-05-15 16:46:51 +08:00
里面 PW 和 BDUSS 在哪里详细改?
|
9
liujiantao 2016-05-15 17:54:23 +08:00
围观苍老师
|
10
bdbai 2016-05-15 19:39:50 +08:00 via Android
楼主是 昌维 001 么?好眼熟
|
11
changwei OP @rootliang 你打错了吧,应该是 kw , kw 是 keyword 也就是贴吧名,在数据库里面手动添加即可。 bduss 不需要写,相当于匿名访问贴吧
|
17
willhunger 2016-05-15 21:21:00 +08:00
@changwei 艾特泷涯。。。
|
20
kslr 2016-05-16 03:00:42 +08:00 via Android
文件的命名最好统一英文
|
21
changwei OP @kslr 谢谢提醒:-),这个还是很早以前写的,当时连 MVC ,框架,设计模式都没学,现在看来这代码真是烂的出奇,哈哈~
|
22
changwei OP @willhunger 我不知道他在 V2EX 里面的 id 是什么啊
|