首頁猿問編譯/鏈接過程是如何工作的？

編譯/鏈接過程是如何工作的？

C C++

繁花如伊 2019-05-30 17:20:24

編譯/鏈接過程是如何工作的？編譯和鏈接過程是如何工作的？(注：這是指堆棧溢出的C+常見問題。如果您想批評以這種形式提供常見問題的想法，那么在元網站上發布的文章引發了這一切就是這樣做的地方。對該問題的回答將在C+聊天室你的答案很可能會被那些想出這個想法的人讀懂。)

查看完整描述

4 回答

烙印99

TA貢獻1829條經驗獲得超13個贊

C+程序的編譯包括三個步驟：

預處理：預處理程序采用C+源代碼文件，并處理#includeS，#defineS和其他預處理指令。這個步驟的輸出是一個“純”C+文件，沒有預處理指令。
編譯：編譯器獲取預處理器的輸出并從中生成一個對象文件.
鏈接：鏈接器獲取編譯器生成的對象文件，并生成庫或可執行文件。

預處理

預處理程序處理預處理指令，就像#include和#define。它不知道C+的語法，這就是為什么必須謹慎使用它的原因。

它一次工作在一個C+源文件上，方法是#include具有相應文件內容的指令(通常只是聲明)，替換宏(#define)，并根據以下內容選擇文本的不同部分：#if, #ifdef和#ifndef指令。

預處理器工作在預處理令牌流上。宏替換定義為用其他令牌替換令牌(操作符)。##當有意義時，啟用合并兩個令牌)。

在所有這些之后，預處理器產生一個單一的輸出，這是由上面描述的轉換產生的令牌流。它還添加了一些特殊的標記，告訴編譯器每一行來自哪里，這樣它就可以使用這些標記來生成合理的錯誤消息。

在此階段，可以通過巧妙地使用#if和#error指令。

編撰

編譯步驟對預處理程序的每個輸出執行。編譯器解析純C+源代碼(現在沒有任何預處理器指令)并將其轉換為程序集代碼。然后調用底層后端(工具鏈中的匯編程序)，將該代碼組裝成生成某種格式的實際二進制文件的機器代碼(ELF，COFF，a.out，.)。此對象文件包含輸入中定義的符號的編譯代碼(二進制形式)。對象文件中的符號按名稱引用。

對象文件可以引用未定義的符號。如果使用聲明，而不提供聲明的定義，則會出現這種情況。編譯器不介意這一點，只要源代碼格式良好，編譯器就會很高興地生成對象文件。

編譯器通常允許您在此時停止編譯。這非常有用，因為使用它，您可以分別編譯每個源代碼文件。它提供的優點是您不需要重新編譯一切如果您只更改一個文件。

生成的對象文件可以放在稱為靜態庫的特殊檔案中，以便以后更容易重用。

在這個階段，報告了“常規”編譯器錯誤，比如語法錯誤或失敗的過載解析錯誤。

鏈接

鏈接器是編譯器生成的對象文件的最終編譯輸出。這個輸出可以是一個共享的(或者是動態的)庫(雖然名稱相似，但它們與前面提到的靜態庫沒有多少共同點)，也可以是一個可執行文件。

它通過用正確的地址替換對未定義符號的引用來鏈接所有對象文件。這些符號中的每一個都可以在其他對象文件或庫中定義。如果它們是在標準庫以外的庫中定義的，則需要將它們告知鏈接器。

在這個階段，最常見的錯誤是缺少定義或重復定義。前者意味著定義不存在(即它們不被寫入)，或者它們所在的對象文件或庫沒有提供給鏈接器。后者是顯而易見的：在兩個不同的對象文件或庫中定義了相同的符號。

反對回復 2019-05-30

慕雪6442864

TA貢獻1812條經驗獲得超5個贊

精簡是指CPU從內存地址加載數據，將數據存儲到內存地址，然后從內存地址順序執行指令，在處理的指令序列中有一些條件跳轉。這三種指令中的每一種都涉及到計算要在機器指令中使用的存儲器單元的地址。由于機器指令的長度取決于所涉及的特定指令，而且由于我們在構建機器代碼時將其中的可變長度串在一起，所以在計算和構建任何地址時需要兩個步驟。

首先，我們盡可能地安排內存分配，然后才能知道每個單元的確切情況。我們計算出字節，或單詞，或構成指令、文字和任何數據的任何東西。我們只是開始分配內存和構建值，這些值將在我們運行時創建程序，并記下我們需要返回并修復地址的任何地方。在那個地方，我們放置一個假人來填充位置，這樣我們就可以繼續計算內存大小。例如，我們的第一個機器代碼可能需要一個單元格。下一個機器代碼可能包含3個單元，包括一個機器代碼單元和兩個地址單元?，F在我們的地址指針是4。我們知道機器單元是什么，這是OP代碼，但是我們必須等待計算地址單元格中的內容，直到我們知道數據的位置，即數據的機器地址是什么。

如果只有一個源文件，理論上編譯器可以在沒有鏈接器的情況下生成完全可執行的機器代碼。在兩次傳遞過程中，它可以計算出任何機器加載或存儲指令所引用的所有數據單元的所有實際地址。它可以計算任何絕對跳轉指令所引用的所有絕對地址。這是一個簡單的編譯器，就像Forth Work中的編譯器，沒有鏈接器。

鏈接器允許單獨編譯代碼塊。這可以加快構建代碼的整個過程，并允許在以后如何使用這些塊時具有一定的靈活性，換句話說，它們可以在內存中重新定位，例如在每個地址中添加1000個地址，以使塊增加1000個地址單元格。

所以編譯器輸出的是尚未完全構建的粗略的機器代碼，而是布局好的，這樣我們就知道了所有東西的大小，換句話說，我們就可以開始計算所有絕對地址的位置。編譯器還輸出一個符號列表，這些符號是名稱/地址對。符號將模塊中機器代碼中的內存偏移量與名稱相關聯。偏移量是到模塊中符號的存儲器位置的絕對距離。

那就是我們找到鏈接器的地方。鏈接器首先將所有這些機器代碼塊連接到一起，并記下每個代碼的起始位置。然后，通過將模塊內部的相對偏移量和模塊在較大布局中的絕對位置相加，計算要固定的地址。

顯然，我過于簡化了這一點，所以您可以嘗試理解它，而且我故意不使用對象文件、符號表等術語。這對我來說是混亂的一部分。

反對回復 2019-05-30

4 回答
0 關注
830 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

編譯/鏈接過程是如何工作的？

編譯/鏈接過程是如何工作的？

4 回答

預處理

編撰

鏈接

添加回答

編譯/鏈接過程是如何工作的？

編譯/鏈接過程是如何工作的？