亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

為什么打破LZCNT的“輸出依賴性”很重要?

為什么打破LZCNT的“輸出依賴性”很重要?

哈士奇WWW 2019-12-05 13:20:45
在進行基準測試時,我測得的吞吐量比我計算的要低得多,我將其縮小到LZCNT指令(TZCNT也是如此),如以下基準測試所示:  xor ecx, ecx_benchloop:  lzcnt eax, edx  add ecx, 1  jnz _benchloop和:  xor ecx, ecx_benchloop:  xor eax, eax  ; this shouldn't help, but it does  lzcnt eax, edx  add ecx, 1  jnz _benchloop第二個版本要快得多。不應該這樣 沒有理由為什么LZCNT應該對其輸出具有輸入依賴性。與BSR / BSF不同,xZCNT指令始終覆蓋其輸出。我正在4770K上運行它,因此LZCNT和TZCNT不會作為BSR / BSF執行。這里發生了什么?
查看完整描述

3 回答

?
蕪湖不蕪

TA貢獻1796條經驗 獲得超7個贊

沒什么可不幸的。您似乎已經排除了對齊方式,而我們只是排除了部分標志的依賴性?!爱斈瞬豢赡艿氖挛飼r,無論多么不可能,仍然是必須存在的事實?!蔽覀兛赡苓€沒有消除所有其他事物,但是看起來越來越像在您的處理器上實現的xZCNT依賴于其輸出寄存器重命名。

查看完整回答
反對 回復 2019-12-05
  • 3 回答
  • 0 關注
  • 670 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號