我已經在帶有 CUDA 10 和合適的 GPU 的 x86-64 Ubuntu 計算機上安裝了 tensorflow(不是從源代碼)。我的目標是攔截(使用 LD_PRELOAD)任何 tensorflow 應用程序的 CUDA 運行時 API。不幸的是,對于我的用例,我無法從源代碼為不是 x86-64 的目標機器構建 tensorflow。我能夠攔截我從用 C++ 編寫的動態加載 cuda 運行時 API 的測試程序進行的 cudaLaunchKernel 調用,并且在第一次檢查時我認為 python 應該類似地動態加載相同的 cuda .so - 我很困惑,因為 LD_PRELOAD 不是適用于在啟用 cuda 的情況下運行的正常安裝的 tensorflow 應用程序。我希望 tensorflow 中的 cudaLaunchKernel 調用應該被我的 LD_PRELOAD 插入庫攔截。這個對嗎?
添加回答
舉報
0/150
提交
取消