這個問題是關于BigQuery Python客戶端中QueryJob對象的方法timeout中的參數。result看起來 的含義相timeout對于 1.24.0 版本已發生變化。例如,1.24.0 版本中QueryJob 的文檔result指出超時為:使用重試之前等待底層 HTTP 傳輸的秒數。如果在后臺發出多個請求,則超時將被解釋為所有請求的大致總時間。據我了解,這可以用作限制result方法調用等待結果的總時間的方法。例如,考慮以下腳本:import loggingfrom google.cloud import bigquery# Set logging level to DEBUG in order to see the HTTP requests# being made by urllib3logging.basicConfig(level=logging.DEBUG)PROJECT_ID = "project_id" # replace by actual project IDclient = bigquery.Client(project=PROJECT_ID)QUERY = ('SELECT name FROM `bigquery-public-data.usa_names.usa_1910_2013` '? ? ? ? 'WHERE state = "TX" '? ? ? ? 'LIMIT 100')TIMEOUT = 30? # in secondsquery_job = client.query(QUERY)? # API request - starts the queryassert query_job.state == 'RUNNING'# Waits for the query to finishiterator = query_job.result(timeout=TIMEOUT)rows = list(iterator)assert query_job.state == 'DONE'據我了解,如果獲取結果所涉及的所有 API 調用加起來超過 30 秒,則調用將result放棄。所以,timeout這里起到了限制方法調用總執行時間的作用result。但是,后來的版本引入了更改。例如,1.27.2 中的文檔result指出超時為:使用重試之前等待底層 HTTP 傳輸的秒數。如果在后臺發出多個請求,則超時適用于每個單獨的請求。如果我理解正確,上面的示例的含義完全改變,并且調用result可能需要超過 30 秒。我的疑問是:如果我使用新版本與舊版本運行上面的腳本,究竟有什么區別result?timeout目前推薦將值傳遞給哪些用例result?在等待查詢結果時,當前推薦的在給定總時間后超時的方法是什么?謝謝。
1 回答

MYYA
TA貢獻1868條經驗 獲得超4個贊
正如您在此修復中所看到的:
傳輸層超時與查詢超時無關,即等待查詢完成的最長時間。
阻塞輪詢使用查詢超時,以便后端在輪詢作業完成時不會阻塞太久,但傳輸可能有不同的超時要求,我們不希望它有時引發不必要的超時錯誤。
對每個底層請求應用超時
由于作業方法不再在方法可能發出的所有請求之間分割超時,因此客戶端方法以相同的方式進行調整。
所以基本的區別在于,在以前的版本中,如果在下面的層中發出許多請求,它們將共享 30 秒的超時。換句話說,如果第一個請求需要 20 秒,第二個請求將在 10 秒后超時。在新版本中,每個請求將有 30 秒的時間。
關于用例,基本上取決于您的應用程序。如果您不能長時間等待可能會丟失的請求,您可以減少超時。
添加回答
舉報
0/150
提交
取消