亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如何插入 tensorflow 中使用的 cuda 運行時 API?

如何插入 tensorflow 中使用的 cuda 運行時 API?

SMILET 2021-12-16 16:12:42
我已經在帶有 CUDA 10 和合適的 GPU 的 x86-64 Ubuntu 計算機上安裝了 tensorflow(不是從源代碼)。我的目標是攔截(使用 LD_PRELOAD)任何 tensorflow 應用程序的 CUDA 運行時 API。不幸的是,對于我的用例,我無法從源代碼為不是 x86-64 的目標機器構建 tensorflow。我能夠攔截我從用 C++ 編寫的動態加載 cuda 運行時 API 的測試程序進行的 cudaLaunchKernel 調用,并且在第一次檢查時我認為 python 應該類似地動態加載相同的 cuda .so - 我很困惑,因為 LD_PRELOAD 不是適用于在啟用 cuda 的情況下運行的正常安裝的 tensorflow 應用程序。我希望 tensorflow 中的 cudaLaunchKernel 調用應該被我的 LD_PRELOAD 插入庫攔截。這個對嗎?
查看完整描述

1 回答

?
qq_笑_17

TA貢獻1818條經驗 獲得超7個贊

看起來 Tensorflow 編寫了 stream_executor 以避免必須使用 CUDA 的運行時 API,而是用開源代碼包裝 CUDA 的驅動程序 API (cuLaunchKernel) 本身。在此對 Tensorflow 的拉取請求中引用了這 一點,以允許插入被拒絕的 CUDA 的運行時 API。同樣,在 TF 源代碼(參見此處)中,我們看到正在積極使用 cu*/driver API 而不是運行時 API。


查看完整回答
反對 回復 2021-12-16
  • 1 回答
  • 0 關注
  • 165 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號