Python numpy 如何优雅的进行矩阵的并行计算

import numpy as np
def how(x, y):
    return x + y
arr = [1, 2, 3, 4, 5, 6]
match_arr = np.zeros((len(arr), len(arr)))
for i in range(0, len(arr)):
    for j in range(0, len(arr)):
        if j >= i:
            X = how(arr[i], arr[j])
            match_arr[i, j] = X
            match_arr[j, i] = X

print(match_arr)
[[ 2.  3.  4.  5.  6.  7.]
 [ 3.  4.  5.  6.  7.  8.]
 [ 4.  5.  6.  7.  8.  9.]
 [ 5.  6.  7.  8.  9. 10.]
 [ 6.  7.  8.  9. 10. 11.]
 [ 7.  8.  9. 10. 11. 12.]]

arr

len

match_arr

NumPy

18 replies • 2021-04-21 07:20:06 +08:00

hsfzxjy

Apr 19, 2021 via Android

arr = np.array([...])
match_arr = arr[None] + arr[:, None]

geelaw

Apr 19, 2021 via iPhone

arr = np.array(arr)
match_arr = np.reshape(arr, (-1, 1)) + np.reshape(arr, (1, -1))

大概是这么个意思，参考 broadcast 的概念。

如果每个元素的计算过程不能用 numpy 内置的运算表达则无法实现，因为 GIL 的存在。

princelai

Apr 19, 2021

```python
a,b = np.meshgrid(arr,arr)
match_arr = a+b
```
不一定高效，但是简单

princelai

Apr 19, 2021

还有一种方法，原理一样
```python
match_arr = np.mgrid[1:7,1:7].sum(axis=0)
```

sunhk25

Apr 19, 2021 via Android

@geelaw 那就是说用自定义的 how 函数来循环计算时还是没有优化方法呗

sunhk25

Apr 19, 2021 via Android

@princelai sum 是我自定义的一个函数

princelai

Apr 19, 2021

@sunhk25 #6 你是想说 how 是你自定义的函数？你不是简单的相加是吗？那上 numba，循环放到 numba 里很快，比 numpy 还快。或者你都有两个传播好的 array 了，你改一下 how 函数不就完了

sunhk25

Apr 19, 2021

@princelai 对是这个意思。我研究一下 numba，谢谢

nikan999

Apr 19, 2021

先用 numba 如果还想快就上进程

hsfzxjy

Apr 19, 2021 via Android

除了 numba，cython 也可以试试。门槛有点高，但是性能优化的上限也高

kickcellardoor

Apr 19, 2021

numba，数据量够大甚至可以 PyTorch, GPU 上来并行

Harry1993

Apr 20, 2021

樓上說 PyTorch，那我來說 TensorFlow 吧

necomancer

Apr 20, 2021

In [4]: from numba import guvectorize, float64, jit
In [5]: @jit(nopython=True)
...: def how(x, y):
...: return x + y
In [6]: @guvectorize([(float64[:], float64[:,:])], '(n)->(n, n)', nopython=True)
...: def f(arr, ret):
...: for i in range(arr.shape[0]):
...: for j in range(arr.shape[0]):
...: if j >= i:
...: tmp = how(arr[i], arr[j])
...: ret[i, j] = tmp
...: ret[j, i] = tmp
In [11]: arr = [np.arange(3), np.arange(10, 13)]

In [12]: f(arr)
Out[12]:
array([[[ 0., 1., 2.],
[ 1., 2., 3.],
[ 2., 3., 4.]],

[[20., 21., 22.],
[21., 22., 23.],
[22., 23., 24.]]])
In [13]: arr = np.arange(3)

In [14]: f(arr)
Out[14]:
array([[0., 1., 2.],
[1., 2., 3.],
[2., 3., 4.]])

necomancer

Apr 20, 2021

想要速度一定要用 nopython=True，但是代码得注意一定不能有 object

necomancer

Apr 20, 2021

这狗 shit 的排版……

necomancer

Apr 20, 2021

另，guvectorize 可以 target='cpu', 'gpu', 'parallel'

necomancer

Apr 21, 2021

我测试了一下，有个简单一点的方法，但是会慢一些：
arr = np.arange(3)
def how(x, y):
....if x < y:
........return x + y
....return x * y
np.frompyfunc(how, 2, 1)(arr[:,None], arr)

frompyfunc 会返回一个 ufunc，从而让 numpy 可以 broadcast 自定义的函数。但是效率似乎没有 numba 的 vectorize/guvectorize 高，尤其是 numba 可以 target='gpu'或者'parallel'

sunhk25

Apr 21, 2021 via Android

@necomancer target 参数学习了