国产伦精品一区二区三区妓国产,亚洲日本伊人以人综合网

我試圖了解我們的 GPU 工作站的單精度和雙精度之間的性能差異。我們的工作站配備了兩個 TITAN RTX GPU，但我在單個 Titan RTX 上運行基準測試。我正在使用 cublas 矩陣乘法測試性能。我將由隨機浮點數或雙精度數組成的 8192x8192 矩陣相乘。為了確保我這邊沒有錯誤，我還在Python中使用cupy庫重復了這個過程，結果非常相似。浮點型的測試結果約為每 1 次乘法 75 毫秒，雙精度型的測試結果約為 2,000 毫秒。如果我有一個較舊的 GPU，這將很有意義，因為 75*32 = 2,400~2000，因此我的雙精度性能將比 https://docs.nvidia 表中預期的差約 32 倍。然而，我的 GPU 的計算能力為 7.5，因此我預計性能只會翻倍 2 倍。其他信息：Ubuntu 18 LTS、nvcc 10.2、驅動程序 440.82。這是 CUDA 代碼：#include <iostream>#include <chrono>#include <string>#include <cuda_runtime.h>#include "cublas_v2.h"#include <math.h>#include <stdio.h>#include <cuda.h>#include <device_functions.h>#include <sstream>#include <time.h>unsigned long mix(unsigned long a, unsigned long b, unsigned long c){? ? a=a-b;? a=a-c;? a=a^(c >> 13);? ? b=b-c;? b=b-a;? b=b^(a << 8);? ? c=c-a;? c=c-b;? c=c^(b >> 13);? ? a=a-b;? a=a-c;? a=a^(c >> 12);? ? b=b-c;? b=b-a;? b=b^(a << 16);? ? c=c-a;? c=c-b;? c=c^(b >> 5);? ? a=a-b;? a=a-c;? a=a^(c >> 3);? ? b=b-c;? b=b-a;? b=b^(a << 10);? ? c=c-a;? c=c-b;? c=c^(b >> 15);? ? return c;}using namespace std;int main(){? ? ? ? int deviceCount;? ? ? ? cudaGetDeviceCount(&deviceCount);? ? ? ? cudaDeviceProp deviceProp;? ? ? ? cublasStatus_t err;? ? ? ? cudaGetDeviceProperties(&deviceProp, 0);? ? ? ? printf("Detected %d devices \n", deviceCount);? ? ? ? printf("Device %d has compute capability %d.%d:\n\t maxshmem %d. \n\t maxthreads per block %d. \n\t max threads dim %d. %d. %d.\n ", 0,? ? ? ? ? ? ? ? deviceProp.major, deviceProp.minor, deviceProp.sharedMemPerBlock, deviceProp.maxThreadsPerBlock, deviceProp.maxThreadsDim[0],? ? ? ? ? ? ? ? deviceProp.maxThreadsDim[1], deviceProp.maxThreadsDim[2]);? ? ? ? cudaEvent_t start_d, stop_d;? ? ? ? cudaEventCreate(&start_d);? ? ? ? cudaEventCreate(&stop_d);? ? ? ? //RND insicialization? ? ? ? unsigned long seed = mix(clock(), time(NULL), 0);? ? ? ?srand(seed);? ? ? ? int N=8192;? ? ? ? int Nloops=2;? ? ? ? ? ? ? ? }}

查看完整描述

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

Titan RTX 上雙精度和單精度的矩陣乘法基準測試

Titan RTX 上雙精度和單精度的矩陣乘法基準測試

1 回答

添加回答

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

Titan RTX 上雙精度和單精度的矩陣乘法基準測試

Titan RTX 上雙精度和單精度的矩陣乘法基準測試

1 回答

添加回答