亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

在 Numba 中,如何在面向 CUDA 時將數組復制到常量內存中?

在 Numba 中,如何在面向 CUDA 時將數組復制到常量內存中?

繁華開滿天機 2023-05-09 10:48:50
我有一個示例代碼來說明這個問題:import numpy as npfrom numba import cuda, typesimport configsdef main():    arr = np.empty(0, dtype=np.uint8)    stream = cuda.stream()    d_arr = cuda.to_device(arr, stream=stream)    kernel[configs.BLOCK_COUNT, configs.THREAD_COUNT, stream](d_arr)@cuda.jit(types.void(    types.Array(types.uint8, 1, 'C'),), debug=configs.CUDA_DEBUG)def kernel(d_arr):    arr = cuda.const.array_like(d_arr)if __name__ == "__main__":    main()當我用 cuda-memcheck 運行這段代碼時,我得到:numba.errors.ConstantInferenceError: Failed in nopython mode pipeline (step: nopython rewrites)Constant inference not possible for: arg(0, name=d_arr)這似乎表明我傳入的數組不是常量,因此無法將其復制到常量內存中——是這樣嗎?如果是這樣,我如何將作為輸入提供給內核的數組復制到常量內存?
查看完整描述

1 回答

?
守著一只汪

TA貢獻1872條經驗 獲得超4個贊

您不會使用作為輸入提供給內核的數組復制到常量數組。該類型的輸入數組已在設備中,設備代碼無法寫入常量內存。


常量內存只能從主機代碼寫入,并且常量語法期望數組是主機數組。


這是一個例子:


$ cat t32.py

import numpy as np

from numba import cuda, types, int32, int64


a = np.ones(3,dtype=np.int32)

@cuda.jit

def generate_mutants(b):

    c_a = cuda.const.array_like(a)

    b[0] = c_a[0]


if __name__ == "__main__":

    b = np.zeros(3,dtype=np.int32)

    generate_mutants[1, 1](b)

    print(b)

$ python t32.py

[1 0 0]

$

請注意,與 CUDA C/C++ 相比,Numba CUDA 中常量內存的實現有一些行為差異,這個問題突出了其中的一些差異。


查看完整回答
反對 回復 2023-05-09
  • 1 回答
  • 0 關注
  • 167 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號