我所知道的精细到每个进程的监控都仅仅反映实时情况;
而可以看到历史数据的都只有综合的图表,没有细分到进程、用户的,比如整个机器的 CPU/内存 /磁盘读写使用情况。
所以想请教一下,想可回溯地统计精细到进程、用户等的信息怎么做到。
1
hadoop 2017-07-10 11:09:36 +08:00 via Android 1
进程级流量监控没看到比较好的
|
2
ldbC5uTBj11yaeh5 2017-07-10 11:16:18 +08:00 via Android 1
我用 Prometheus 和 granfana 做过,自己写 exporter 而已,不难。
cpu 内存磁盘最容易。其中 tcp 流量监控复杂一些,要用内核的新一些的特性才比较容易做。 |
3
ldbC5uTBj11yaeh5 2017-07-10 11:18:23 +08:00 via Android
哦,忘了说,据我所知,市面上没有现成开源的,所以我才自己弄的。
|
5
ldbC5uTBj11yaeh5 2017-07-10 13:17:48 +08:00 1
@hadoop 嗯,用的是 tcp_info 这个结构,原理和 netflix tcptop 差不多。不是非常准确,但是够用了。
|
6
ldbC5uTBj11yaeh5 2017-07-10 13:25:51 +08:00
也许我那天可以问上面,是否可以把这个 exporter 开源,也算解决痛点填补空白了。
|
7
ldbC5uTBj11yaeh5 2017-07-10 13:39:00 +08:00 1
哦,还有变通的一招。
把进程容器化,然后用 cadvisor。(这货非常吃 CPU 慎用) |
8
rswl 2017-07-10 14:34:48 +08:00 1
grafana + influxdb + telegraf
|
9
QQ2171775959 2017-07-12 11:04:41 +08:00
专业的工具还是有蛮多的嘛。。。老兄多去试一下。。
|