編譯器最基礎的保證是什麼_什麼是編譯器

㈠學習編譯原理，需要什麼基礎

編譯原理內容包括語言和文法、詞法分析、語法分析、語法制導翻譯、中間代碼生成、存儲管理、代碼優化和目標代碼生成。
主要是講怎麼做程序的編譯器。

需要數學基礎和很強的邏輯思維。

編譯原理里的字元閉包是指有限循環。關於閉包這些名詞解釋，你們的課程應該有離散數學吧？會有對這些概念的解釋。

編譯原理這書啊。得花老大精力去看了。每一行都會是至關重要的。如果你漏看了哪一節，或許接下來看到的新字母就不知道是什麼意思了。

所以要反復看，反復用邏輯思維推敲。做習題，習題類型也就幾種，做熟了就很簡單

㈡誰能介紹一下C++和java

1) 最大的障礙在於速度：解釋過的Java要比C的執行速度慢上約20倍。無論什麼都不能阻止Java語言進行編譯。寫作本書的時候，剛剛出現了一些准實時編譯器，它們能顯著加快速度。當然，我們完全有理由認為會出現適用於更多流行平台的純固有編譯器，但假若沒有那些編譯器，由於速度的限制，必須有些問題是Java不能解決的。

(2) 和C++一樣，Java也提供了兩種類型的注釋。

(3) 所有東西都必須置入一個類。不存在全局函數或者全局數據。如果想獲得與全局函數等價的功能，可考慮將static方法和static數據置入一個類里。注意沒有象結構、枚舉或者聯合這一類的東西，一切只有「類」（Class）！

(4) 所有方法都是在類的主體定義的。所以用C++的眼光看，似乎所有函數都已嵌入，但實情並非如何（嵌入的問題在後面講述）。

(5) 在Java中，類定義採取幾乎和C++一樣的形式。但沒有標志結束的分號。沒有class foo這種形式的類聲明，只有類定義。

class aType()

void aMethod() {/* 方法主體 */}

}

(6) Java中沒有作用域范圍運算符「::」。Java利用點號做所有的事情，但可以不用考慮它，因為只能在一個類里定義元素。即使那些方法定義，也必須在一個類的內部，所以根本沒有必要指定作用域的范圍。我們注意到的一項差異是對static方法的調用：使用ClassName.methodName()。除此以外，package（包）的名字是用點號建立的，並能用import關鍵字實現C++的「
import java.awt.*;

（
(7) 與C++類似，Java含有一系列「主類型」（Primitive type），以實現更有效率的訪問。在Java中，這些類型包括boolean，char，byte，short，int，long，float以及double。所有主類型的大小都是固有的，且與具體的機器無關（考慮到移植的問題）。這肯定會對性能造成一定的影響，具體取決於不同的機器。對類型的檢查和要求在Java里變得更苛刻。例如：

■條件表達式只能是boolean（布爾）類型，不可使用整數。

■必須使用象X+Y這樣的一個表達式的結果；不能僅僅用「X+Y」來實現「副作用」。

(8) char（字元）類型使用國際通用的16位Unicode字元集，所以能自動表達大多數國家的字元。

(9) 靜態引用的字串會自動轉換成String對象。和C及C++不同，沒有獨立的靜態字元數組字串可供使用。

(10) Java增添了三個右移位運算符「>>>」，具有與「邏輯」右移位運算符類似的功用，可在最末尾插入零值。「>>」則會在移位的同時插入符號位（即「算術」移位）。

(11) 盡管表面上類似，但與C++相比，Java數組採用的是一個頗為不同的結構，並具有獨特的行為。有一個只讀的length成員，通過它可知道數組有多大。而且一旦超過數組邊界，運行期檢查會自動丟棄一個異常。所有數組都是在內存「堆」里創建的，我們可將一個數組分配給另一個（只是簡單地復制數組句柄）。數組標識符屬於第一級對象，它的所有方法通常都適用於其他所有對象。

(12) 對於所有不屬於主類型的對象，都只能通過new命令創建。和C++不同，Java沒有相應的命令可以「在堆棧上」創建不屬於主類型的對象。所有主類型都只能在堆棧上創建，同時不使用new命令。所有主要的類都有自己的「封裝（器）」類，所以能夠通過new創建等價的、以內存「堆」為基礎的對象（主類型數組是一個例外：它們可象C++那樣通過集合初始化進行分配，或者使用new）。

(13) Java中不必進行提前聲明。若想在定義前使用一個類或方法，只需直接使用它即可——編譯器會保證使用恰當的定義。所以和在C++中不同，我們不會碰到任何涉及提前引用的問題。

(14) Java沒有預處理機。若想使用另一個庫里的類，只需使用import命令，並指定庫名即可。不存在類似於預處理機的宏。

(15) Java用包代替了命名空間。由於將所有東西都置入一個類，而且由於採用了一種名為「封裝」的機制，它能針對類名進行類似於命名空間分解的操作，所以命名的問題不再進入我們的考慮之列。數據包也會在單獨一個庫名下收集庫的組件。我們只需簡單地「import」（導入）一個包，剩下的工作會由編譯器自動完成。

(16) 被定義成類成員的對象句柄會自動初始化成null。對基本類數據成員的初始化在Java里得到了可靠的保障。若不明確地進行初始化，它們就會得到一個默認值（零或等價的值）。可對它們進行明確的初始化（顯式初始化）：要麼在類內定義它們，要麼在構建器中定義。採用的語法比C++的語法更容易理解，而且對於static和非static成員來說都是固定不變的。我們不必從外部定義static成員的存儲方式，這和C++是不同的。

(17) 在Java里，沒有象C和C++那樣的指針。用new創建一個對象的時候，會獲得一個引用（本書一直將其稱作「句柄」）。例如：

String s = new String("howdy");

然而，C++引用在創建時必須進行初始化，而且不可重定義到一個不同的位置。但Java引用並不一定局限於創建時的位置。它們可根據情況任意定義，這便消除了對指針的部分需求。在C和C++里大量採用指針的另一個原因是為了能指向任意一個內存位置（這同時會使它們變得不安全，也是Java不提供這一支持的原因）。指針通常被看作在基本變數數組中四處移動的一種有效手段。Java允許我們以更安全的形式達到相同的目標。解決指針問題的終極方法是「固有方法」（已在附錄A討論）。將指針傳遞給方法時，通常不會帶來太大的問題，因為此時沒有全局函數，只有類。而且我們可傳遞對對象的引用。Java語言最開始聲稱自己「完全不採用指針！」但隨著許多程序員都質問沒有指針如何工作？於是後來又聲明「採用受到限制的指針」。大家可自行判斷它是否「真」的是一個指針。但不管在何種情況下，都不存在指針「算術」。

(18) Java提供了與C++類似的「構建器」（Constructor）。如果不自己定義一個，就會獲得一個默認構建器。而如果定義了一個非默認的構建器，就不會為我們自動定義默認構建器。這和C++是一樣的。注意沒有復制構建器，因為所有自變數都是按引用傳遞的。

(19) Java中沒有「破壞器」（Destructor）。變數不存在「作用域」的問題。一個對象的「存在時間」是由對象的存在時間決定的，並非由垃圾收集器決定。有個finalize()方法是每一個類的成員，它在某種程度上類似於C++的「破壞器」。但finalize()是由垃圾收集器調用的，而且只負責釋放「資源」（如打開的文件、套接字、埠、URL等等）。如需在一個特定的地點做某樣事情，必須創建一個特殊的方法，並調用它，不能依賴finalize()。而在另一方面，C++中的所有對象都會（或者說「應該」）破壞，但並非Java中的所有對象都會被當作「垃圾」收集掉。由於Java不支持破壞器的概念，所以在必要的時候，必須謹慎地創建一個清除方法。而且針對類內的基礎類以及成員對象，需要明確調用所有清除方法。

(20) Java具有方法「過載」機制，它的工作原理與C++函數的過載幾乎是完全相同的。

(21) Java不支持默認自變數。

(22) Java中沒有goto。它採取的無條件跳轉機制是「break 標簽」或者「continue 標准」，用於跳出當前的多重嵌套循環。

(23) Java採用了一種單根式的分級結構，因此所有對象都是從根類Object統一繼承的。而在C++中，我們可在任何地方啟動一個新的繼承樹，所以最後往往看到包含了大量樹的「一片森林」。在Java中，我們無論如何都只有一個分級結構。盡管這表面上看似乎造成了限制，但由於我們知道每個對象肯定至少有一個Object介面，所以往往能獲得更強大的能力。C++目前似乎是唯一沒有強制單根結構的唯一一種OO語言。

(24) Java沒有模板或者參數化類型的其他形式。它提供了一系列集合：Vector（向量），Stack（堆棧）以及Hashtable（散列表），用於容納Object引用。利用這些集合，我們的一系列要求可得到滿足。但這些集合並非是為實現象C++「標准模板庫」（STL）那樣的快速調用而設計的。Java 1.2中的新集合顯得更加完整，但仍不具備正宗模板那樣的高效率使用手段。

(25) 「垃圾收集」意味著在Java中出現內存漏洞的情況會少得多，但也並非完全不可能（若調用一個用於分配存儲空間的固有方法，垃圾收集器就不能對其進行跟蹤監視）。然而，內存漏洞和資源漏洞多是由於編寫不當的finalize()造成的，或是由於在已分配的一個塊尾釋放一種資源造成的（「破壞器」在此時顯得特別方便）。垃圾收集器是在C++基礎上的一種極大進步，使許多編程問題消彌於無形之中。但對少數幾個垃圾收集器力有不逮的問題，它卻是不大適合的。但垃圾收集器的大量優點也使這一處缺點顯得微不足道。

(26) Java內建了對多線程的支持。利用一個特殊的Thread類，我們可通過繼承創建一個新線程（放棄了run()方法）。若將synchronized（同步）關鍵字作為方法的一個類型限制符使用，相互排斥現象會在對象這一級發生。在任何給定的時間，只有一個線程能使用一個對象的synchronized方法。在另一方面，一個synchronized方法進入以後，它首先會「鎖定」對象，防止其他任何synchronized方法再使用那個對象。只有退出了這個方法，才會將對象「解鎖」。在線程之間，我們仍然要負責實現更復雜的同步機制，方法是創建自己的「監視器」類。遞歸的synchronized方法可以正常運作。若線程的優先等級相同，則時間的「分片」不能得到保證。

(27) 我們不是象C++那樣控制聲明代碼塊，而是將訪問限定符（public，private和protected）置入每個類成員的定義里。若未規定一個「顯式」（明確的）限定符，就會默認為「友好的」（friendly）。這意味著同一個包里的其他元素也可以訪問它（相當於它們都成為C++的「friends」——朋友），但不可由包外的任何元素訪問。類——以及類內的每個方法——都有一個訪問限定符，決定它是否能在文件的外部「可見」。private關鍵字通常很少在Java中使用，因為與排斥同一個包內其他類的訪問相比，「友好的」訪問通常更加有用。然而，在多線程的環境中，對private的恰當運用是非常重要的。Java的protected關鍵字意味著「可由繼承者訪問，亦可由包內其他元素訪問」。注意Java沒有與C++的protected關鍵字等價的元素，後者意味著「只能由繼承者訪問」（以前可用「private protected」實現這個目的，但這一對關鍵字的組合已被取消了）。

(28) 嵌套的類。在C++中，對類進行嵌套有助於隱藏名稱，並便於代碼的組織（但C++的「命名空間」已使名稱的隱藏顯得多餘）。Java的「封裝」或「打包」概念等價於C++的命名空間，所以不再是一個問題。Java 1.1引入了「內部類」的概念，它秘密保持指向外部類的一個句柄——創建內部類對象的時候需要用到。這意味著內部類對象也許能訪問外部類對象的成員，毋需任何條件——就好象那些成員直接隸屬於內部類對象一樣。這樣便為回調問題提供了一個更優秀的方案——C++是用指向成員的指針解決的。

(29) 由於存在前面介紹的那種內部類，所以Java里沒有指向成員的指針。

(30) Java不存在「嵌入」（inline）方法。Java編譯器也許會自行決定嵌入一個方法，但我們對此沒有更多的控制權力。在Java中，可為一個方法使用final關鍵字，從而「建議」進行嵌入操作。然而，嵌入函數對於C++的編譯器來說也只是一種建議。

(31) Java中的繼承具有與C++相同的效果，但採用的語法不同。Java用extends關鍵字標志從一個基礎類的繼承，並用super關鍵字指出准備在基礎類中調用的方法，它與我們當前所在的方法具有相同的名字（然而，Java中的super關鍵字只允許我們訪問父類的方法——亦即分級結構的上一級）。通過在C++中設定基礎類的作用域，我們可訪問位於分級結構較深處的方法。亦可用super關鍵字調用基礎類構建器。正如早先指出的那樣，所有類最終都會從Object里自動繼承。和C++不同，不存在明確的構建器初始化列表。但編譯器會強迫我們在構建器主體的開頭進行全部的基礎類初始化，而且不允許我們在主體的後面部分進行這一工作。通過組合運用自動初始化以及來自未初始化對象句柄的異常，成員的初始化可得到有效的保證。

1045頁程序

(32) Java中的繼承不會改變基礎類成員的保護級別。我們不能在Java中指定public，private或者protected繼承，這一點與C++是相同的。此外，在衍生類中的優先方法不能減少對基礎類方法的訪問。例如，假設一個成員在基礎類中屬於public，而我們用另一個方法代替了它，那麼用於替換的方法也必須屬於public（編譯器會自動檢查）。

(33) Java提供了一個interface關鍵字，它的作用是創建抽象基礎類的一個等價物。在其中填充抽象方法，且沒有數據成員。這樣一來，對於僅僅設計成一個介面的東西，以及對於用extends關鍵字在現有功能基礎上的擴展，兩者之間便產生了一個明顯的差異。不值得用abstract關鍵字產生一種類似的效果，因為我們不能創建屬於那個類的一個對象。一個abstract（抽象）類可包含抽象方法（盡管並不要求在它裡麵包含什麼東西），但它也能包含用於具體實現的代碼。因此，它被限製成一個單一的繼承。通過與介面聯合使用，這一方案避免了對類似於C++虛擬基礎類那樣的一些機制的需要。

為創建可進行「例示」（即創建一個實例）的一個interface（介面）的版本，需使用implements關鍵字。它的語法類似於繼承的語法，如下所示：

1046頁程序

(34) Java中沒有virtual關鍵字，因為所有非static方法都肯定會用到動態綁定。在Java中，程序員不必自行決定是否使用動態綁定。C++之所以採用了virtual，是由於我們對性能進行調整的時候，可通過將其省略，從而獲得執行效率的少量提升（或者換句話說：「如果不用，就沒必要為它付出代價」）。virtual經常會造成一定程度的混淆，而且獲得令人不快的結果。final關鍵字為性能的調整規定了一些范圍——它向編譯器指出這種方法不能被取代，所以它的范圍可能被靜態約束（而且成為嵌入狀態，所以使用C++非virtual調用的等價方式）。這些優化工作是由編譯器完成的。

(35) Java不提供多重繼承機制（MI），至少不象C++那樣做。與protected類似，MI表面上是一個很不錯的主意，但只有真正面對一個特定的設計問題時，才知道自己需要它。由於Java使用的是「單根」分級結構，所以只有在極少的場合才需要用到MI。interface關鍵字會幫助我們自動完成多個介面的合並工作。

(36) 運行期的類型標識功能與C++極為相似。例如，為獲得與句柄X有關的信息，可使用下述代碼：

X.getClass().getName();

為進行一個「類型安全」的緊縮造型，可使用：

derived d = (derived)base;

這與舊式風格的C造型是一樣的。編譯器會自動調用動態造型機制，不要求使用額外的語法。盡管它並不象C++的「new casts」那樣具有易於定位造型的優點，但Java會檢查使用情況，並丟棄那些「異常」，所以它不會象C++那樣允許壞造型的存在。

(37) Java採取了不同的異常控制機制，因為此時已經不存在構建器。可添加一個finally從句，強制執行特定的語句，以便進行必要的清除工作。Java中的所有異常都是從基礎類Throwable里繼承而來的，所以可確保我們得到的是一個通用介面。

1047頁程序

(38) Java的異常規范比C++的出色得多。丟棄一個錯誤的異常後，不是象C++那樣在運行期間調用一個函數，Java異常規范是在編譯期間檢查並執行的。除此以外，被取代的方法必須遵守那一方法的基礎類版本的異常規范：它們可丟棄指定的異常或者從那些異常衍生出來的其他異常。這樣一來，我們最終得到的是更為「健壯」的異常控制代碼。

(39) Java具有方法過載的能力，但不允許運算符過載。String類不能用+和+=運算符連接不同的字串，而且String表達式使用自動的類型轉換，但那是一種特殊的內建情況。

(40) 通過事先的約定，C++中經常出現的const問題在Java里已得到了控制。我們只能傳遞指向對象的句柄，本地副本永遠不會為我們自動生成。若希望使用類似C++按值傳遞那樣的技術，可調用clone()，生成自變數的一個本地副本（盡管clone()的設計依然尚顯粗糙——參見第12章）。根本不存在被自動調用的副本構建器。為創建一個編譯期的常數值，可象下面這樣編碼：

static final int SIZE = 255

static final int BSIZE = 8 * SIZE

(41) 由於安全方面的原因，「應用程序」的編程與「程序片」的編程之間存在著顯著的差異。一個最明顯的問題是程序片不允許我們進行磁碟的寫操作，因為這樣做會造成從遠程站點下載的、不明來歷的程序可能胡亂改寫我們的磁碟。隨著Java 1.1對數字簽名技術的引用，這一情況已有所改觀。根據數字簽名，我們可確切知道一個程序片的全部作者，並驗證他們是否已獲得授權。Java 1.2會進一步增強程序片的能力。

(42) 由於Java在某些場合可能顯得限制太多，所以有時不願用它執行象直接訪問硬體這樣的重要任務。Java解決這個問題的方案是「固有方法」，允許我們調用由其他語言寫成的函數（目前只支持C和C++）。這樣一來，我們就肯定能夠解決與平台有關的問題（採用一種不可移植的形式，但那些代碼隨後會被隔離起來）。程序片不能調用固有方法，只有應用程序才可以。

(43) Java提供對注釋文檔的內建支持，所以源碼文件也可以包含它們自己的文檔。通過一個單獨的程序，這些文檔信息可以提取出來，並重新格式化成HTML。這無疑是文檔管理及應用的極大進步。

(44) Java包含了一些標准庫，用於完成特定的任務。C++則依靠一些非標準的、由其他廠商提供的庫。這些任務包括（或不久就要包括）：

■連網

■資料庫連接（通過JDBC）

■多線程

■分布式對象（通過RMI和CORBA）

■壓縮

■商貿

由於這些庫簡單易用，而且非常標准，所以能極大加快應用程序的開發速度。

(45) Java 1.1包含了Java Beans標准，後者可創建在可視編程環境中使用的組件。由於遵守同樣的標准，所以可視組件能夠在所有廠商的開發環境中使用。由於我們並不依賴一家廠商的方案進行可視組件的設計，所以組件的選擇餘地會加大，並可提高組件的效能。除此之外，Java Beans的設計非常簡單，便於程序員理解；而那些由不同的廠商開發的專用組件框架則要求進行更深入的學習。

(46) 若訪問Java句柄失敗，就會丟棄一次異常。這種丟棄測試並不一定要正好在使用一個句柄之前進行。根據Java的設計規范，只是說異常必須以某種形式丟棄。許多C++運行期系統也能丟棄那些由於指針錯誤造成的異常。

(47) Java通常顯得更為健壯，為此採取的手段如下：

■對象句柄初始化成null（一個關鍵字）

■句柄肯定會得到檢查，並在出錯時丟棄異常

■所有數組訪問都會得到檢查，及時發現邊界違例情況

■自動垃圾收集，防止出現內存漏洞

■明確、「傻瓜式」的異常控制機制

■為多線程提供了簡單的語言支持

■對網路程序片進行位元組碼校驗

㈢編譯器本身是如何進行測試的

編譯器最重要的性質就是保證語義的正確。比如，從高級語言翻譯到機器指令之後，指令必須正確的表達原來程序的意思。所以一般編譯器測試都包含一些源程序，用來覆蓋可能出現的各種情況。基本的原則是：原來程序的結果 = 編譯後機器指令運行的結果。機器指令運行的結果很容易知道，運行一下就知道了。可是原來程序的結果你怎麼知道呢？
為了解決這個「原來程序語義」的問題，最好是寫一個解釋器，准確無誤的表達原來的代碼的語義。所以我們的要求就是：
高級語言解釋器（源程序） = 機器執行（機器代碼）
由於處理器其實就是一個用來執行機器代碼的解釋器，這里有一個很美好的對稱關系：
interp1(L1) = interp2(L2)
另外還有一個問題，就是編譯器一般需要經過多個轉化步驟（叫做 pass）才能最後編譯為機器指令。比如，
L2 = pass1(source)
L3 = pass2(L2)
L4 = pass3(L3)
Ln = passN(Ln-1)
machine_code = codegen(Ln)
由於源程序經過了很多步驟猜得到最後的機器指令，如果你使用上面的公式，就會出現以下一些情況：
1. 知道結果錯了，但是卻不知道到底是哪一個 pass 錯了。
2. 結果沒有錯，但是中間卻有 pass 實際上是錯的。但是由於之前的 pass 把輸入程序的一些結構給「優化」掉了，所以錯的那個 pass 其實沒能得到觸發錯誤的那個數據結構。所以測試沒能發現錯誤。如果以後前面的那個 pass 被修改，錯誤就會暴露出來。這是非常難以發現的潛伏的危險。
為了防止這些情況出現，一些編譯器（比如 Chez Scheme 和 Kent Dybvig 的課程編譯器）使用了對每一個 pass 進行測試的做法。具體的方法就是為每一個中間語言都寫一個解釋器，把這語言的語義完全的表示出來。這樣我們就需要檢查一組等式：
L2 = pass1(source)
高級語言編譯器（源程序） = interp2(L2) // 測試 pass1 的正確性
L3 = pass2(L2)
interp2(L2) = interp3(L3) // 測試 pass2 的正確性
這樣一來我們就能獨立的判斷每一個 pass 的正確性了。
這些是基本的語義測試原理。另外除了語義，可能還有一些「表面」一些的測試，它們看代碼本身，而不只看它的語義。比如尾遞歸優化的測試應該確保輸出程序的尾遞歸得到正確的處理，等等。這些是語義測試檢查不到的，因為尾遞歸沒有正確處理的程序大部分也能輸出正確的結果。
普通的單元測試方法也可以用來測試一些編譯器里的輔助函數，但那些不是編譯器特有的，所以就不講了。
另外，就像所有測試的局限性一樣，你沒法枚舉所有可能出現的輸入，所以以上的測試方法其實也不能保證編譯器的完全正確。

㈣編譯器做什麼工作

1. 詞法分析詞法分析器根據詞法規則識別出源程序中的各個記號（token），每個記號代表一類單詞（lexeme）。源程序中常見的記號可以歸為幾大類：關鍵字、標識符、字面量和特殊符號。詞法分析器的輸入是源程序，輸出是識別的記號流。詞法分析器的任務是把源文件的字元流轉換成記號流。本質上它查看連續的字元然後把它們識別為「單詞」。 2. 語法分析語法分析器根據語法規則識別出記號流中的結構（短語、句子），並構造一棵能夠正確反映該結構的語法樹。 3. 語義分析語義分析器根據語義規則對語法樹中的語法單元進行靜態語義檢查，如果類型檢查和轉換等，其目的在於保證語法正確的結構在語義上也是合法的。 4. 中間代碼生成中間代碼生成器根據語義分析器的輸出生成中間代碼。中間代碼可以有若干種形式，它們的共同特徵是與具體機器無關。最常用的一種中間代碼是三地址碼，它的一種實現方式是四元式。三地址碼的優點是便於閱讀、便於優化。 5. 中間代碼優化優化是編譯器的一個重要組成部分，由於編譯器將源程序翻譯成中間代碼的工作是機械的、按固定模式進行的，因此，生成的中間代碼往往在時間和空間上有很大浪費。當需要生成高效目標代碼時，就必須進行優化。 6. 目標代碼生成目標代碼生成是編譯器的最後一個階段。在生成目標代碼時要考慮以下幾個問題：計算機的系統結構、指令系統、寄存器的分配以及內存的組織等。編譯器生成的目標程序代碼可以有多種形式：匯編語言、可重定位二進制代碼、內存形式。 7 符號表管理符號表的作用是記錄源程序中符號的必要信息，並加以合理組織，從而在編譯器的各個階段能對它們進行快速、准確的查找和操作。符號表中的某些內容甚至要保留到程序的運行階段。 8 出錯處理用戶編寫的源程序中往往會有一些錯誤，可分為靜態錯誤和動態錯誤兩類。所謂動態錯誤，是指源程序中的邏輯錯誤，它們發生在程序運行的時候，也被稱作動態語義錯誤，如變數取值為零時作為除數，數組元素引用時下標出界等。靜態錯誤又可分為語法錯誤和靜態語義錯誤。語法錯誤是指有關語言結構上的錯誤，如單詞拼寫錯、表達式中缺少操作數、begin和end不匹配等。靜態語義錯誤是指分析源程序時可以發現的語言意義上的錯誤，如加法的兩個操作數中一個是整型變數名，而另一個是數組名等。

㈤學習編譯原理要有什麼基礎

㈥編譯器能夠完成的工作是

1. 詞法分析詞法分析器根據詞法規則識別出源程序中的各個記號（token），每個記號代表一類單詞（lexeme）。源程序中常見的記號可以歸為幾大類：關鍵字、標識符、字面量和特殊符號。詞法分析器的輸入是源程序，輸出是識別的記號流。詞法分析器的任務是把源文件的字元流轉換成記號流。本質上它查看連續的字元然後把它們識別為「單詞」。
2. 語法分析語法分析器根據語法規則識別出記號流中的結構（短語、句子），並構造一棵能夠正確反映該結構的語法樹。
3. 語義分析語義分析器根據語義規則對語法樹中的語法單元進行靜態語義檢查，如果類型檢查和轉換等，其目的在於保證語法正確的結構在語義上也是合法的。
4. 中間代碼生成中間代碼生成器根據語義分析器的輸出生成中間代碼。中間代碼可以有若干種形式，它們的共同特徵是與具體機器無關。最常用的一種中間代碼是三地址碼，它的一種實現方式是四元式。三地址碼的優點是便於閱讀、便於優化。
5. 中間代碼優化
優化是編譯器的一個重要組成部分，由於編譯器將源程序翻譯成中間代碼的工作是機械的、按固定模式進行的，因此，生成的中間代碼往往在時間和空間上有很大浪費。當需要生成高效目標代碼時，就必須進行優化。
6. 目標代碼生成
目標代碼生成是編譯器的最後一個階段。在生成目標代碼時要考慮以下幾個問題：計算機的系統結構、指令系統、寄存器的分配以及內存的組織等。編譯器生成的目標程序代碼可以有多種形式：匯編語言、可重定位二進制代碼、內存形式。
7 符號表管理
符號表的作用是記錄源程序中符號的必要信息，並加以合理組織，從而在編譯器的各個階段能對它們進行快速、准確的查找和操作。符號表中的某些內容甚至要保留到程序的運行階段。
8 出錯處理用戶編寫的源程序中往往會有一些錯誤，可分為靜態錯誤和動態錯誤兩類。所謂動態錯誤，是指源程序中的邏輯錯誤，它們發生在程序運行的時候，也被稱作動態語義錯誤，如變數取值為零時作為除數，數組元素引用時下標出界等。靜態錯誤又可分為語法錯誤和靜態語義錯誤。語法錯誤是指有關語言結構上的錯誤，如單詞拼寫錯、表達式中缺少操作數、begin和end不匹配等。靜態語義錯誤是指分析源程序時可以發現的語言意義上的錯誤，如加法的兩個操作數中一個是整型變數名，而另一個是數組名等。

㈦什麼是編譯器

編譯器

編譯器是一種特殊的程序，它可以把以特定編程語言寫成的程序變為機器可以運行的機器碼。我們把一個程序寫好，這時我們利用的環境是文本編輯器。這時我程序把程序稱為源程序。在此以後程序員可以運行相應的編譯器，通過指定需要編譯的文件的名稱就可以把相應的源文件（通過一個復雜的過程）轉化為機器碼了。

[編輯]編譯器工作方法
首先編譯器進行語法分析，也就是要把那些字元串分離出來。然後進行語義分析，就是把各個由語法分析分析出的語法單元的意義搞清楚。最後生成的是目標文件，我們也稱為obj文件。再經過鏈接器的鏈接就可以生成最後的可執行代碼了。有些時候我們需要把多個文件產生的目標文件進行鏈接，產生最後的代碼。我們把一過程稱為交叉鏈接。

一個現代編譯器的主要工作流程如下：

* 源程序（source code）→預處理器（preprocessor）→編譯器（compiler）→匯編程序（assembler）→目標程序（object code）→連接器（鏈接器，Linker）→可執行程序（executables）

工作原理

編譯是從源代碼（通常為高級語言）到能直接被計算機或虛擬機執行的目標代碼（通常為低級語言或機器言）。然而，也存在從低級語言到高級語言的編譯器，這類編譯器中用來從由高級語言生成的低級語言代碼重新生成高級語言代碼的又被叫做反編譯器。也有從一種高級語言生成另一種高級語言的編譯器，或者生成一種需要進一步處理的的中間代碼的編譯器（又叫級聯）。

典型的編譯器輸出是由包含入口點的名字和地址以及外部調用（到不在這個目標文件中的函數調用）的機器代碼所組成的目標文件。一組目標文件，不必是同一編譯器產生，但使用的編譯器必需採用同樣的輸出格式，可以鏈接在一起並生成可以由用戶直接執行的可執行程序。

編譯器種類

編譯器可以生成用來在與編譯器本身所在的計算機和操作系統（平台）相同的環境下運行的目標代碼，這種編譯器又叫做「本地」編譯器。另外，編譯器也可以生成用來在其它平台上運行的目標代碼，這種編譯器又叫做交叉編譯器。交叉編譯器在生成新的硬體平台時非常有用。「源碼到源碼編譯器」是指用一種高級語言作為輸入，輸出也是高級語言的編譯器。例如: 自動並行化編譯器經常採用一種高級語言作為輸入，轉換其中的代碼，並用並行代碼注釋對它進行注釋（如OpenMP）或者用語言構造進行注釋（如FORTRAN的DOALL指令）。

預處理器（preprocessor）

作用是通過代入預定義等程序段將源程序補充完整。

編譯器前端（frontend）

前端主要負責解析（parse）輸入的源程序，由詞法分析器和語法分析器協同工作。詞法分析器負責把源程序中的『單詞』（Token）找出來,語法分析器把這些分散的單詞按預先定義好的語法組裝成有意義的表達式，語句，函數等等。例如「a = b + c;」前端詞法分析器看到的是「a, =, b , +, c;」，語法分析器按定義的語法，先把他們組裝成表達式「b + c」，再組裝成「a = b + c」的語句。前端還負責語義（semantic checking）的檢查，例如檢測參與運算的變數是否是同一類型的，簡單的錯誤處理。最終的結果常常是一個抽象的語法樹（abstract syntax tree，或 AST），這樣後端可以在此基礎上進一步優化，處理。

編譯器後端（backend）

編譯器後端主要負責分析，優化中間代碼（Intermediate representation）以及生成機器代碼（Code Generation）。

一般說來所有的編譯器分析，優化，變型都可以分成兩大類：函數內（intraproceral）還是函數之間（interproceral）進行。很明顯，函數間的分析，優化更准確，但需要更長的時間來完成。

編譯器分析（compiler analysis）的對象是前端生成並傳遞過來的中間代碼，現代的優化型編譯器（optimizing compiler）常常用好幾種層次的中間代碼來表示程序，高層的中間代碼（high level IR）接近輸入的源程序的格式，與輸入語言相關（language dependent），包含更多的全局性的信息，和源程序的結構；中層的中間代碼（middle level IR）與輸入語言無關，低層的中間代碼(Low level IR)與機器語言類似。不同的分析，優化發生在最適合的那一層中間代碼上。

常見的編譯分析有函數調用樹（call tree），控制流程圖（Control flow graph），以及在此基礎上的變數定義－使用，使用－定義鏈（define-use/use-define or u-d/d-u chain），變數別名分析（alias analysis），指針分析（pointer analysis），數據依賴分析（data dependence analysis）等等。

上述的程序分析結果是編譯器優化（compiler optimization）和程序變形（compiler transformation）的前提條件。常見的優化和變新有：函數內嵌（inlining），無用代碼刪除（Dead code elimination），標准化循環結構（loop normalization），循環體展開（loop unrolling），循環體合並，分裂（loop fusion，loop fission），數組填充（array padding），等等。優化和變形的目的是減少代碼的長度，提高內存（memory），緩存（cache）的使用率，減少讀寫磁碟，訪問網路數據的頻率。更高級的優化甚至可以把序列化的代碼（serial code）變成並行運算，多線程的代碼（parallelized，multi-threaded code）。

機器代碼的生成是優化變型後的中間代碼轉換成機器指令的過程。現代編譯器主要採用生成匯編代碼（assembly code）的策略，而不直接生成二進制的目標代碼（binary object code）。即使在代碼生成階段，高級編譯器仍然要做很多分析，優化，變形的工作。例如如何分配寄存器（register allocatioin），如何選擇合適的機器指令（instruction selection），如何合並幾句代碼成一句等等。

㈧編譯原理

編譯原理是計算機專業的一門重要專業課，旨在介紹編譯程序構造的一般原理和基本方法。內容包括語言和文法、詞法分析、語法分析、語法制導翻譯、中間代碼生成、存儲管理、代碼優化和目標代碼生成。編譯原理是計算機專業設置的一門重要的專業課程。編譯原理課程是計算機相關專業學生的必修課程和高等學校培養計算機專業人才的基礎及核心課程，同時也是計算機專業課程中最難及最挑戰學習能力的課程之一。編譯原理課程內容主要是原理性質，高度抽象[1]。

中文名
編譯原理[1]
外文名
Compilers: Principles, Techniques, and Tools[1]
領域
計算機專業的一門重要專業課[1]
快速
導航
編譯器

編譯原理課程

編譯技術的發展

編譯的基本流程

編譯過程概述
基本概念
編譯原理即是對高級程序語言進行翻譯的一門科學技術, 我們都知道計算機程序由程序語言編寫而成, 在早期計算機程序語言發展較為緩慢, 因為計算機存儲的數據和執行的程序都是由0、1代碼組合而成的, 那麼在早期程序員編寫計算機程序時必須十分了解計算機的底層指令代碼通過將這些微程序指令組合排列從而完成一個特定功能的程序, 這就對程序員的要求非常高了。人們一直在研究如何如何高效的開發計算機程序, 使編程的門檻降低。[2]
編譯器
C語言編譯器是一種現代化的設備, 其需要藉助計算機編譯程序, C語言編譯器的設計是一項專業性比較強的工作, 設計人員需要考慮計算機程序繁瑣的設計流程, 還要考慮計算機用戶的需求。計算機的種類在不斷增加, 所以, 在對C語言編譯器進行設計時, 一定要增加其適用性。C語言具有較強的處理能力, 其屬於結構化語言, 而且在計算機系統維護中應用比較多, C語言具有高效率的優點, 在其不同類型的計算機中應用比較多。[3]
C語言編譯器前端設計
編譯過程一般是在計算機系統中實現的, 是將源代碼轉化為計算機通用語言的過程。編譯器中包含入口點的地址、名稱以及機器代碼。編譯器是計算機程序中應用比較多的工具, 在對編譯器進行前端設計時, 一定要充分考慮影響因素, 還要對詞法、語法、語義進行分析。[3]
1 詞法分析[3]
詞法分析是編譯器前端設計的基礎階段, 在這一階段, 編譯器會根據設定的語法規則, 對源程序進行標記, 在標記的過程中, 每一處記號都代表著一類單詞, 在做記號的過程中, 主要有標識符、關鍵字、特殊符號等類型, 編譯器中包含詞法分析器、輸入源程序、輸出識別記號符, 利用這些功能可以將字型大小轉化為熟悉的單詞。[3]
2 語法分析[3]
語法分析是指利用設定的語法規則, 對記號中的結構進行標識, 這包括句子、短語等方式, 在標識的過程中, 可以形成特殊的結構語法樹。語法分析對編譯器功能的發揮有著重要影響, 在設計的過程中, 一定要保證標識的准確性。[3]
3 語義分析[3]
語義分析也需要藉助語法規則, 在對語法單元的靜態語義進行檢查時, 要保證語法規則設定的准確性。在對詞法或者語法進行轉化時, 一定要保證語法結構設置的合法性。在對語法、詞法進行檢查時, 語法結構設定不合理, 則會出現編譯錯誤的問題。前端設計對精確性要求比較好, 設計人員能夠要做好校對工作, 這會影響到編譯的准確性, 如果前端設計存在失誤, 則會影響C語言編譯的效果。[3]

㈨做個編譯器需要什麼前置條件

用C語言比較好，效率比較高。
用JAVA也可以，好調試。
我用過以上兩種做過編譯器，別的語言不好說。
做個編譯器不難，一個人做也用不了太多時間。但相關的東西要做的話就花時間了。比如編輯環境，比如調試跟蹤器。

㈩編譯器是怎麼被編譯出來的

我們要在Y系統上做一個C語言的編譯器，假定：X與Y是不同的兩種計算機，其指令系統不兼容。考慮以下幾種情況：
Case 1: Y上沒有C語言編譯器，但X系統上有。
那麼我們可以先在X系統上開發一個針對Y系統的C語言交叉編譯器。然後用這個交叉編譯器重新編譯已有的這個C編譯器的源代碼，就可以得到能在Y系統上運行的C語言編譯器了。（交叉編譯器：在X系統上運行的編譯器，但編譯出來的目標代碼在Y系統上運行。嵌入式平台上的程序基本都是交叉編譯得到的，因為嵌入式平台上很少會有自己的編譯器）
Case 2: X，Y上都沒有C語言編譯器，但有另一種語言的編譯器。
a.我們可以先劃出C語言的一個子集，這個子集必須滿足兩個條件：首先，必須足夠簡單，簡單到可以用另一種語言來編寫接受這個子集的編譯器；其次，必須足夠強大，強大到用這個語言子集就可以編寫出接受C語言的編譯器。（你一定奇怪為什麼一個語言的子集就能寫出接收整個語言的編譯器，呵呵。我猜是因為一個語言的很多復雜特性都是由簡單特性構成的，就像一個struct結構完全可以用幾個定義在一起的簡單變數代替實現；而且，編譯器的實現往往不會用到這個語言的高級特性，需要用的都加到那個子集里就行。）
b.再用另一種語言編寫一個能接受這個C語言子集的編譯器，只要保證可以在Y系統上正確運行就行，並不對其效率作要求，因為基本上它只被用一次。
c.然後，用C語言的子集編寫一個在Y系統上的C語言編譯器，用上一步得到的編譯器編譯得到可用的Y系統上的C編譯器。

導航:首頁 > 源碼編譯 > 編譯器最基礎的保證是什麼

編譯器最基礎的保證是什麼

與編譯器最基礎的保證是什麼相關的資料