我有一个二维NumPy数组,想把其中大于或等于阈值T的所有数值替换成255.0。就我所知,最基本的方法是。
shape = arr.shape
result = np.zeros(shape)
for x in range(0, shape[0]):
for y in range(0, shape[1]):
if arr[x, y] >= T:
result[x, y] = 255
1.什么是最简明的pythonic方式?
2.有没有更快的方法(可能不那么简洁和/或不那么pythonic)来做这件事?
这将是人类头部MRI扫描的窗口/水平调整子程序的一部分。二维numpy数组是图像像素数据。
我认为最快和最简洁的方法是使用NumPy内置的Fancy索引。如果你有一个名为arr'的
ndarray',你可以用一个值x'来替换所有元素
>255`,如下所示。
arr[arr > 255] = x
我在我的机器上用一个500 x 500的随机矩阵运行这个程序,用5替换所有的值>0.5,平均花费7.59ms。
In [1]: import numpy as np
In [2]: A = np.random.rand(500, 500)
In [3]: timeit A[A > 0.5] = 5
100 loops, best of 3: 7.59 ms per loop
因为你实际上想要一个不同的数组,在arr < 255
的情况下是arr
,否则是255
,这可以简单地完成。
result = np.minimum(arr, 255)
更一般地说,对于一个下限和/或上限。
result = np.clip(arr, 0, 255)
如果你只想访问超过255的值,或者更复杂的东西,@mtitan8'的答案更通用,但np.clip
和np.minimum
(或np.maximum
)对你的情况来说更好、更快。
In [292]: timeit np.minimum(a, 255)
100000 loops, best of 3: 19.6 µs per loop
In [293]: %%timeit
.....: c = np.copy(a)
.....: c[a>255] = 255
.....:
10000 loops, best of 3: 86.6 µs per loop
如果你想就地处理(即修改arr
而不是创建result
),你可以使用np.minimum
的out
参数。
np.minimum(arr, 255, out=arr)
或
np.clip(arr, 0, 255, arr)
(out=
名称是可选的,因为参数的顺序与函数的定义相同)。
对于原地修改,布尔索引的速度加快了很多(不需要单独制作然后修改副本),但仍然不如`最小'的速度。
In [328]: %%timeit
.....: a = np.random.randint(0, 300, (100,100))
.....: np.minimum(a, 255, a)
.....:
100000 loops, best of 3: 303 µs per loop
In [329]: %%timeit
.....: a = np.random.randint(0, 300, (100,100))
.....: a[a>255] = 255
.....:
100000 loops, best of 3: 356 µs per loop
作为比较,如果你想用最小值和最大值来限制你的数值,如果没有`clip',你就必须做两次,比如说
np.minimum(a, 255, a)
np.maximum(a, 0, a)
或。
a[a>255] = 255
a[a<0] = 0
你可以考虑使用numpy.putmask。
np.putmask(arr, arr>=T, 255.0)
下面是与Numpy'的内置索引的性能比较。
In [1]: import numpy as np
In [2]: A = np.random.rand(500, 500)
In [3]: timeit np.putmask(A, A>0.5, 5)
1000 loops, best of 3: 1.34 ms per loop
In [4]: timeit A[A > 0.5] = 5
1000 loops, best of 3: 1.82 ms per loop