⑴ 請問編寫軟體的第一個語言程序是如何誕生的
早期的計算機軟體都是用匯編語言直接編寫的,這種狀況持續了數年。當人們發現為不同類型的CPU編寫可重用軟體的開銷要明顯高於編寫編譯器時,人們發明了高級編程語言。由於早期的計算機的內存很少,當大家實現編譯器時,遇到了許多技術難題。
大約在20世紀50年代末期,與機器無關的編程語言被首次提出。隨後,人們開發了幾種實驗性質的編譯器。第一個編譯器是由Grace Hopper於1952年為A-0語言編寫的。通常認為,1957年由IBM的約翰·巴科斯領導的FORTRAN團隊介紹了第一個完整的編譯器。1960年,COBOL成為一種較早的能在多種架構下被編譯的語言。
高級語言在許多領域流行起來。由於新的編程語言支持的功能越來越多,計算機的架構越來越復雜,這使得編譯器也越來越復雜。
早期的編譯器是用匯編語言編寫的。首個能編譯自己源程序的編譯器是在1962年由麻省理工學院的Hart和Levin製作的。從20世紀70年代起,實現能編譯自己源程序的編譯器變得越來越可行,不過還是用Pascal和C語言來實現編譯器更加流行。製作某種語言的第一個能編譯器,要麼需要用其它語言來編寫,要麼就像Hart和Levin製作Lisp編譯器那樣,用解釋器來運行編譯器。
引自 : 維基網路
⑵ 編譯器與解釋器的區別和工作原理
編譯器與解釋器的區別和工作原理
編譯器和解釋器是計算機程序語言處理中的兩種基本工具,它們的主要區別在於處理源代碼的方式和執行效率。
一、區別
工作方式:
編譯器:將源代碼一次性轉換成目標代碼(機器語言),然後生成可執行程序。這個過程在程序執行之前完成,用戶拿到的是可以直接運行的程序。
解釋器:在程序運行時,逐行讀取源代碼,將其轉換成中間代碼(如位元組碼),然後解釋執行。解釋器不會生成獨立的可執行程序,而是作為源代碼和機器之間的橋梁。
執行效率:
編譯器:由於編譯後的程序是機器語言,可以直接被CPU執行,因此執行速度通常較快。
解釋器:每次執行都需要將源代碼轉換為中間代碼,再由解釋器解釋執行,因此執行速度相對較慢。但解釋器可以動態地解釋執行代碼,具有更高的靈活性。
跨平台性:
編譯器:生成的可執行程序與特定的CPU架構和操作系統相關,因此跨平台性較差。需要在不同的平台上重新編譯源代碼。
解釋器:只要平台上有相應的解釋器,源代碼就可以在該平台上運行,無需重新編譯。因此,解釋型語言通常具有更好的跨平台性。
二、工作原理
編譯器的工作原理:
預處理:處理源代碼中的宏定義、包含文件等,生成預處理後的源代碼。
編譯:將預處理後的源代碼轉換為目標代碼(二進制機器語言)。
鏈接:將目標代碼與庫文件(如操作系統提供的API)鏈接,生成可執行程序。
編譯器的工作流程可以概括為:源代碼 → 預處理器 → 編譯器 → 目標代碼 → 鏈接器 → 可執行程序。
解釋器的工作原理:
詞法分析:將源代碼逐行讀取,分解成單詞(token)。
語法分析:根據語法規則,將單片語成語法樹(parse tree)。
中間代碼生成:將語法樹轉換為中間代碼(如位元組碼)。
解釋執行:解釋器逐條讀取中間代碼,將其轉換為機器指令並執行。
解釋器的工作流程可以概括為:源代碼 → 解釋器 → 詞法分析 → 語法分析 → 中間代碼生成 → 解釋執行。
三、示例說明
以Python為例,它是一種解釋型語言,使用解釋器執行源代碼。Python的源代碼無需預先編譯成可執行程序,而是在程序執行時,由解釋器逐行讀取並解釋執行。Python的解釋器有多種,如CPython、IPython、PyPy等,它們各自具有不同的特點和性能表現。
四、JIT即時編譯器
JIT(Just-In-Time)即時編譯器是一種結合了編譯器和解釋器優點的技術。它在程序運行時,將頻繁執行的代碼(熱點代碼)編譯成機器指令,以提高執行效率。JIT編譯器可以在解釋器的基礎上,動態地優化代碼的執行速度。Java虛擬機(JVM)中的JIT編譯器就是一個典型的例子。
綜上所述,編譯器和解釋器在工作方式、執行效率和跨平台性等方面存在顯著差異。了解它們的區別和工作原理,有助於我們更好地選擇和使用編程語言及其工具鏈。
⑶ 什麼是編譯器
編譯器
編譯器是一種特殊的程序,它可以把以特定編程語言寫成的程序變為機器可以運行的機器碼。我們把一個程序寫好,這時我們利用的環境是文本編輯器。這時我程序把程序稱為源程序。在此以後程序員可以運行相應的編譯器,通過指定需要編譯的文件的名稱就可以把相應的源文件(通過一個復雜的過程)轉化為機器碼了。
[編輯]編譯器工作方法
首先編譯器進行語法分析,也就是要把那些字元串分離出來。然後進行語義分析,就是把各個由語法分析分析出的語法單元的意義搞清楚。最後生成的是目標文件,我們也稱為obj文件。再經過鏈接器的鏈接就可以生成最後的可執行代碼了。有些時候我們需要把多個文件產生的目標文件進行鏈接,產生最後的代碼。我們把一過程稱為交叉鏈接。
一個現代編譯器的主要工作流程如下:
* 源程序(source code)→預處理器(preprocessor)→編譯器(compiler)→匯編程序(assembler)→目標程序(object code)→連接器(鏈接器,Linker)→可執行程序(executables)
工作原理
編譯是從源代碼(通常為高級語言)到能直接被計算機或虛擬機執行的目標代碼(通常為低級語言或機器言)。然而,也存在從低級語言到高級語言的編譯器,這類編譯器中用來從由高級語言生成的低級語言代碼重新生成高級語言代碼的又被叫做反編譯器。也有從一種高級語言生成另一種高級語言的編譯器,或者生成一種需要進一步處理的的中間代碼的編譯器(又叫級聯)。
典型的編譯器輸出是由包含入口點的名字和地址以及外部調用(到不在這個目標文件中的函數調用)的機器代碼所組成的目標文件。一組目標文件,不必是同一編譯器產生,但使用的編譯器必需採用同樣的輸出格式,可以鏈接在一起並生成可以由用戶直接執行的可執行程序。
編譯器種類
編譯器可以生成用來在與編譯器本身所在的計算機和操作系統(平台)相同的環境下運行的目標代碼,這種編譯器又叫做「本地」編譯器。另外,編譯器也可以生成用來在其它平台上運行的目標代碼,這種編譯器又叫做交叉編譯器。交叉編譯器在生成新的硬體平台時非常有用。「源碼到源碼編譯器」是指用一種高級語言作為輸入,輸出也是高級語言的編譯器。例如: 自動並行化編譯器經常採用一種高級語言作為輸入,轉換其中的代碼,並用並行代碼注釋對它進行注釋(如OpenMP)或者用語言構造進行注釋(如FORTRAN的DOALL指令)。
預處理器(preprocessor)
作用是通過代入預定義等程序段將源程序補充完整。
編譯器前端(frontend)
前端主要負責解析(parse)輸入的源程序,由詞法分析器和語法分析器協同工作。詞法分析器負責把源程序中的『單詞』(Token)找出來,語法分析器把這些分散的單詞按預先定義好的語法組裝成有意義的表達式,語句 ,函數等等。 例如「a = b + c;」前端詞法分析器看到的是「a, =, b , +, c;」,語法分析器按定義的語法,先把他們組裝成表達式「b + c」,再組裝成「a = b + c」的語句。 前端還負責語義(semantic checking)的檢查,例如檢測參與運算的變數是否是同一類型的,簡單的錯誤處理。最終的結果常常是一個抽象的語法樹(abstract syntax tree,或 AST),這樣後端可以在此基礎上進一步優化,處理。
編譯器後端(backend)
編譯器後端主要負責分析,優化中間代碼(Intermediate representation)以及生成機器代碼(Code Generation)。
一般說來所有的編譯器分析,優化,變型都可以分成兩大類: 函數內(intraproceral)還是函數之間(interproceral)進行。很明顯,函數間的分析,優化更准確,但需要更長的時間來完成。
編譯器分析(compiler analysis)的對象是前端生成並傳遞過來的中間代碼,現代的優化型編譯器(optimizing compiler)常常用好幾種層次的中間代碼來表示程序,高層的中間代碼(high level IR)接近輸入的源程序的格式,與輸入語言相關(language dependent),包含更多的全局性的信息,和源程序的結構;中層的中間代碼(middle level IR)與輸入語言無關,低層的中間代碼(Low level IR)與機器語言類似。 不同的分析,優化發生在最適合的那一層中間代碼上。
常見的編譯分析有函數調用樹(call tree),控制流程圖(Control flow graph),以及在此基礎上的變數定義-使用,使用-定義鏈(define-use/use-define or u-d/d-u chain),變數別名分析(alias analysis),指針分析(pointer analysis),數據依賴分析(data dependence analysis)等等。
上述的程序分析結果是編譯器優化(compiler optimization)和程序變形(compiler transformation)的前提條件。常見的優化和變新有:函數內嵌(inlining),無用代碼刪除(Dead code elimination),標准化循環結構(loop normalization),循環體展開(loop unrolling),循環體合並,分裂(loop fusion,loop fission),數組填充(array padding),等等。優化和變形的目的是減少代碼的長度,提高內存(memory),緩存(cache)的使用率,減少讀寫磁碟,訪問網路數據的頻率。更高級的優化甚至可以把序列化的代碼(serial code)變成並行運算,多線程的代碼(parallelized,multi-threaded code)。
機器代碼的生成是優化變型後的中間代碼轉換成機器指令的過程。現代編譯器主要採用生成匯編代碼(assembly code)的策略,而不直接生成二進制的目標代碼(binary object code)。即使在代碼生成階段,高級編譯器仍然要做很多分析,優化,變形的工作。例如如何分配寄存器(register allocatioin),如何選擇合適的機器指令(instruction selection),如何合並幾句代碼成一句等等。