1
yangqi 2017-05-06 01:14:16 +08:00
|
2
aliipay OP @yangqi 看上去很厉害的样子,先慢慢研究下。
问题是多线程实现?我的程序本身是多线程了,cpu 已经满了,不知道能否提升性能 |
3
denghongcai 2017-05-06 01:38:02 +08:00
|
4
denghongcai 2017-05-06 01:39:56 +08:00
循环次数这么一点点就不要搞 OpenMP 了
|
5
aliipay OP @yangqi
gcc version 4.8.5 20150623 warning: ignoring #pragma omp parallel [-Wunknown-pragmas] 我单独编译一个 demo 是正常的 加入到现有工程就报这个警告 |
6
Fishdrowned 2017-05-06 07:51:38 +08:00 via Android
|
7
aliipay OP @Fishdrowned
这个试过了,能提高 10%左右 |
8
zk8802 2017-05-06 12:10:25 +08:00 via iPhone
开启优化之后,编译器应该可以自动进行 loop unrolling 的。你编译之后的汇编代码长什么样?
|
9
zwzmzd 2017-05-06 13:01:07 +08:00 via iPhone
|
10
billlee 2017-05-06 13:42:56 +08:00
你编译的时候加了 -march=native 吗?
|
11
aliipay OP @billlee 每加,加了更慢
现在用的是-fprefetch-loop-arrays -g -ggdb -D__USE_ISOC99 -DNDEBUG -Ofast -fPIC -Wall -std=c++11 |
12
linux40 2017-05-07 09:34:19 +08:00 via Android
不考虑 memcpy 吗
|
14
linux40 2017-05-07 09:38:25 +08:00 via Android
不考虑 restrict 吗
|