最近在对 C++ 程序做性能优化,程序是多线程执行的。
对比两份 code base,如果使用 collector 监测的话,CPU time 几乎完全一致。 但是如果不使用 collector 监测,就会有 30% 的 CPU time 差异。
有大佬知道是什么原因么?以及,在 collector 无法准确 profiling 的情况下,还有什么办法准确分析性能么?