亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

即時生成矢量常量的最佳指令序列是什么?

即時生成矢量常量的最佳指令序列是什么?

即時生成矢量常量的最佳指令序列是什么?“最佳”是指最少的指令(或最少的微指令,如果有任何指令解碼到一個以上的微指令)。機器碼大?。ㄒ宰止潪閱挝唬┦窍嗟鹊膇nsn計數的平局。從本質上講,恒定生成是新的依賴鏈的開始,因此延遲很重要。在循環內生成常量也很不常見,因此吞吐量和執行端口需求也幾乎無關緊要。生成常量而不是加載常量需要更多指令(全零或全一除外),因此確實會占用寶貴的uop緩存空間。與數據緩存相比,這可能是更為有限的資源。Agner Fog出色的《優化裝配》指南在中對此進行了介紹Section 13.4。表13.10具有用于產生向量序列,每一個元素是0,1,2,3,4,-1,或-2,與從8位到64位單元大小。表13.11具有用于產生一些浮點值序列(0.0,0.5,1.0,1.5,2.0,-2.0,和位掩碼為符號位。)Agner Fog的序列僅出于設計目的或因為已有一段時間沒有更新而僅使用SSE2。簡短的非顯而易見的指令序列還可以生成其他哪些常量? (具有不同移位計數的進一步擴展是顯而易見的,并且沒有“興趣”。)是否有更好的序列來生成Agner Fog列出的常數?如何將128位立即數移動到XMM寄存器說明了一些將任意128b常量放入指令流中的方法,但這通常不明智(它不節省任何空間,并占用大量的uop緩存空間。)
查看完整描述

2 回答

  • 2 回答
  • 0 關注
  • 473 瀏覽

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號