自然語言處理編譯器_C語言和編譯器的關系

⑴ 編譯器的工作原理

編譯是從源代碼（通常為高級語言）到能直接被計算機或虛擬機執行的目標代碼（通常為低級語言或機器語言）的翻譯過程。然而，也存在從低級語言到高級語言的編譯器，這類編譯器中用來從由高級語言生成的低級語言代碼重新生成高級語言代碼的又被叫做反編譯器。也有從一種高級語言生成另一種高級語言的編譯器，或者生成一種需要進一步處理的的中間代碼的編譯器（又叫級聯）。
典型的編譯器輸出是由包含入口點的名字和地址，以及外部調用（到不在這個目標文件中的函數調用）的機器代碼所組成的目標文件。一組目標文件，不必是同一編譯器產生，但使用的編譯器必需採用同樣的輸出格式，可以鏈接在一起並生成可以由用戶直接執行的EXE,
所以我們電腦上的文件都是經過編譯後的文件。

⑵ 常用的編程語言及相應的軟體開發工具有哪些

編程語言俗稱「計算機語言」，種類非常的多，總的來說可以分成機器語言、匯編語言、高級語言三大類。電腦每做的一次動作，一個步驟，都是按照已經用計算機語言編好的程序來執行的，程序是計算機要執行的指令的集合，而程序全部都是用我們所掌握的語言來編寫的。所以人們要控制計算機一定要通過計算機語言向計算機發出命令。其中簡單的，可以分為低級語言和高級語言。
低級語言:是一種更接近計算機的語言（二進制語言），比如說匯編語言，效率高（速度快，完成同樣功能需要的代碼少），但不好學，不好編。
高級語言：更接近人類的自然語言（編譯器），比如：
Fortran,Delphi,PowerBuilder,VB：比較過時
C,C++：運行效率高
asp,php：編寫web程序，就是網站
vbscript,javascript,python:腳本語言
HTML：標記語言，用於編寫網頁
css:樣式表語言，用於定義網頁的樣式風格
sql:用於操作資料庫中的數據 bigdata 海量數據
J2EE(java),.Net(C#,VB.Net,J#,...Asp.Net) JAVA 2 Enterprise Edition Sun公司 1995，Microsoft 2002年，具有後發優勢。
另外：
Android安卓開發(主要用Java語言)
IOS開發(用Objective C)

⑶ 編譯器的歷史

20世紀50年代，IBM的John Backus帶領一個研究小組對FORTRAN語言及其編譯器進行開發。但由於當時人們對編譯理論了解不多，開發工作變得既復雜又艱苦。與此同時，Noam Chomsky開始了他對自然語言結構的研究。他的發現最終使得編譯器的結構異常簡單，甚至還帶有了一些自動化。Chomsky的研究導致了根據語言文法的難易程度以及識別它們所需要的演算法來對語言分類。正如Chomsky架構（Chomsky Hierarchy），它包括了文法的四個層次：0型文法、1型文法、2型文法和3型文法，且其中的每一個都是其前者的特殊情況。2型文法（或上下文無關文法）被證明是程序設計語言中最有用的，而且今天它已代表著程序設計語言結構的標准方式。分析問題（parsing problem，用於上下文無關文法識別的有效演算法）的研究是在60年代和70年代，它相當完善的解決了這個問題。它已是編譯原理中的一個標准部分。
有限狀態自動機（Finite Automation）和正則表達式（Regular Expression）同上下文無關文法緊密相關，它們與Chomsky的3型文法相對應。對它們的研究與Chomsky的研究幾乎同時開始，並且引出了表示程序設計語言的單詞的符號方式。
人們接著又深化了生成有效目標代碼的方法，這就是最初的編譯器，它們被一直使用至今。人們通常將其稱為優化技術（Optimization Technique），但因其從未真正地得到過被優化了的目標代碼而僅僅改進了它的有效性，因此實際上應稱作代碼改進技術（Code Improvement Technique）。
當分析問題變得好懂起來時，人們就在開發程序上花費了很大的功夫來研究這一部分的編譯器自動構造。這些程序最初被稱為編譯器的編譯器（Compiler-compiler），但更確切地應稱為分析程序生成器（Parser Generator），這是因為它們僅僅能夠自動處理編譯的一部分。這些程序中最著名的是Yacc（Yet Another Compiler-compiler），它是由Steve Johnson在1975年為Unix系統編寫的。類似的，有限狀態自動機的研究也發展了一種稱為掃描程序生成器（Scanner Generator）的工具，Lex（與Yacc同時，由Mike Lesk為Unix系統開發）是這其中的佼佼者。
在20世紀70年代後期和80年代早期，大量的項目都貫注於編譯器其它部分的生成自動化，這其中就包括了代碼生成。這些嘗試並未取得多少成功，這大概是因為操作太復雜而人們又對其不甚了解。
編譯器設計最近的發展包括：首先，編譯器包括了更加復雜演算法的應用程序它用於推斷或簡化程序中的信息；這又與更為復雜的程序設計語言的發展結合在一起。其中典型的有用於函數語言編譯的Hindley-Milner類型檢查的統一演算法。其次，編譯器已越來越成為基於窗口的交互開發環境（Interactive Development Environment，IDE）的一部分，它包括了編輯器、連接程序、調試程序以及項目管理程序。這樣的IDE標准並沒有多少，但是對標準的窗口環境進行開發已成為方向。另一方面，盡管在編譯原理領域進行了大量的研究，但是基本的編譯器設計原理在近20年中都沒有多大的改變，它正迅速地成為計算機科學課程中的中心環節。
在20世紀90年代，作為GNU項目或其它開放源代碼項目標一部分，許多免費編譯器和編譯器開發工具被開發出來。這些工具可用來編譯所有的計算機程序語言。它們中的一些項目被認為是高質量的，而且對現代編譯理論感興趣的人可以很容易的得到它們的免費源代碼。
大約在1999年，SGI公布了他們的一個工業化的並行化優化編譯器Pro64的源代碼，後被全世界多個編譯器研究小組用來做研究平台，並命名為Open64。Open64的設計結構好，分析優化全面，是編譯器高級研究的理想平台。
編譯器相關專業術語: 1. compiler編譯器；編譯程序 2. on-line compiler 連線編譯器 3. precompiler 預編譯器 4. serial compiler 串列編譯器 5. system-specific compiler 特殊系統編譯器 6. Information Presentation Facility Compiler 信息展示設施編譯器 7. Compiler Monitor System 編譯器監視系統

⑷ C語言和編譯器的關系

c語言，只是一個程序設計語言。不是理論，不是思想，不是體系結構。只是語言。
C語言的語法不一致並不是編譯器導致的。而是語言自然發展導致的。編譯器只是支持某種標準的c語言。
並且c語言現在也有標准了，ansi c。不同語法的問題可以不用關心。因為你基本上接觸不到另外一種語法。而且越新的編譯器，支持越好。

⑸ 用什麼fortran編譯器好啊專業要用這門語言，剛開始學。

這是每個游戲編程FAQ里都有的問題。這個問題每星期都會在游戲開發論壇上被問上好幾次。這是個很好的問題，但是，沒人能給出簡單的答案。在某些應用程序中，總有一些計算機語言優於其他語言。下面是幾種用於編寫游戲的主要編程語言的介紹及其優缺點。希望這篇文章能幫助你做出決定。

1、C語言

如果說FORTRAN和COBOL是第一代高級編譯語言，那麼C語言就是它們的孫子輩。C語言是Dennis Ritchie在七十年代創建的，它功能更強大且與ALGOL保持更連續的繼承性，而ALGOL則是COBOL和FORTRAN的結構化繼承者。C語言被設計成一個比它的前輩更精巧、更簡單的版本，它適於編寫系統級的程序，比如操作系統。在此之前，操作系統是使用匯編語言編寫的，而且不可移植。C語言是第一個使得系統級代碼移植成為可能的編程語言。

C語言支持結構化編程，也就是說C的程序被編寫成一些分離的函數呼叫（調用）的集合，這些呼叫是自上而下運行，而不像一個單獨的集成塊的代碼使用GOTO語句控制流程。因此，C程序比起集成性的FORTRAN及COBOL的「空心粉式代碼」代碼要簡單得多。事實上，C仍然具有GOTO語句，不過它的功能被限制了，僅當結構化方案非常復雜時才建議使用。

正由於它的系統編程根源，將C和匯編語言進行結合是相當容易的。函數調用介面非常簡單，而且匯編語言指令還能內嵌到C代碼中，所以，不需要連接獨立的匯編模塊。

優點：有益於編寫小而快的程序。很容易與匯編語言結合。具有很高的標准化，因此其他平台上的各版本非常相似。

缺點：不容易支持面向對象技術。語法有時會非常難以理解，並造成濫用。

移植性：C語言的核心以及ANSI函數調用都具有移植性，但僅限於流程式控制制、內存管理和簡單的文件處理。其他的東西都跟平台有關。比如說，為Windows和Mac開發可移植的程序，用戶界面部分就需要用到與系統相關的函數調用。這一般意味著你必須寫兩次用戶界面代碼，不過還好有一些庫可以減輕工作量。

用C語言編寫的游戲：非常非常多。

資料：C語言的經典著作是《The C Programming Language》，它經過多次修改，已經擴展到最初的三倍大，但它仍然是介紹C的優秀書本。一本極好的教程是《The Waite Group's C Primer Plus》。

2、C++

C++語言是具有面向對象特性的C語言的繼承者。面向對象編程，或稱OOP是結構化編程的下一步。OO程序由對象組成，其中的對象是數據和函數離散集合。有許多可用的對象庫存在，這使得編程簡單得只需要將一些程序「建築材料」堆在一起（至少理論上是這樣）。比如說，有很多的GUI和資料庫的庫實現為對象的集合。

C++總是辯論的主題，尤其是在游戲開發論壇里。有幾項C++的功能，比如虛擬函數，為函數呼叫的決策制定增加了一個額外層次，批評家很快指出C++程序將變得比相同功能的C程序來得大和慢。C++的擁護者則認為，用C寫出與虛擬函數等價的代碼同樣會增加開支。這將是一個還在進行，而且不可能很快得出結論的爭論。

我認為，C++的額外開支只是使用更好的語言的小付出。同樣的爭論發生在六十年代高級程序語言如COBOL和FORTRAN開始取代匯編成為語言所選的時候。批評家正確的指出使用高級語言編寫的程序天生就比手寫的匯編語言來得慢，而且必然如此。而高級語言支持者認為這么點小小的性能損失是值得的，因為COBOL和FORTRAN程序更容易編寫和維護。

優點：組織大型程序時比C語言好得多。很好的支持面向對象機制。通用數據結構，如鏈表和可增長的陣列組成的庫減輕了由於處理低層細節的負擔。

缺點：非常大而復雜。與C語言一樣存在語法濫用問題。比C慢。大多數編譯器沒有把整個語言正確的實現。

移植性：比C語言好多了，但依然不是很樂觀。因為它具有與C語言相同的缺點，大多數可移植性用戶界面庫都使用C++對象實現。

使用C++編寫的游戲：非常非常多。大多數的商業游戲是使用C或C++編寫的。

資料：最新版的《The C++ Programming Language》非常好。作為教程，有兩個陣營，一個假定你知道C，另外一個假定你不知道。到目前為止，最好的C++教程是《Who's Afraid of C++》，如果你已經熟知C，那麼試一下《Teach Yourself C++》。

3、我該學習C++或是該從C開始

我不喜歡這種說法，但它是繼「我該使用哪門語言」之後最經常被問及的問題。很不幸，不存在標准答案。你可以自學C並使用它來寫程序，從而節省一大堆的時間，不過使用這種方法有兩個弊端：

你將錯過那些面向對象的知識，因為它可能在你的游戲中使得數據建模更有效率的東西。

最大的商業游戲，包括第一人稱射擊游戲很多並沒有使用C++。但是，這些程序的作者即使使用老的C的格式，他們通常堅持使用面向對象編程技術。如果你只想學C，至少要自學OO（面向對象）編程技術。OO是模擬（游戲）的完美方法，如果你不學習OO，你將不得不「辛苦」的工作。

4、匯編語言

顯然，匯編是第一個計算機語言。匯編語言實際上是你計算機處理器實際運行的指令的命令形式表示法。這意味著你將與處理器的底層打交道，比如寄存器和堆棧。如果你要找的是類英語且有相關的自我說明的語言，這不是你想要的。

確切的說，任何你能在其他語言里做到的事情，匯編都能做，只是不那麼簡單 — 這是當然，就像說你既可以開車到某個地方，也可以走路去，只是難易之分。話雖不錯，但是新技術讓東西變得更易於使用。

總的來說，匯編語言不會在游戲中單獨應用。游戲使用匯編主要是使用它那些能提高性能的零零碎碎的部分。比如說，毀滅戰士整體使用C來編寫，有幾段繪圖程序使用匯編。這些程序每秒鍾要調用數千次，因此，盡可能的簡潔將有助於提高游戲的性能。而從C里調用匯編寫的函數是相當簡單的，因此同時使用兩種語言不成問題。

特別注意：語言的名字叫「匯編」。把匯編語言翻譯成真實的機器碼的工具叫「匯編程序」。把這門語言叫做「匯編程序」這種用詞不當相當普遍，因此，請從這門語言的正確稱呼作為起點出發。

優點：最小、最快的語言。匯編高手能編寫出比任何其他語言能實現的快得多的程序。你將是利用處理器最新功能的第一人，因為你能直接使用它們。

缺點：難學、語法晦澀、堅持效率，造成大量額外代碼 — 不適於心臟虛弱者。

移植性：接近零。因為這門語言是為一種單獨的處理器設計的，根本沒移植性可言。如果使用了某個特殊處理器的擴展功能，你的代碼甚至無法移植到其他同類型的處理器上（比如，AMD的3DNow指令是無法移植到其它奔騰系列的處理器上的）。

使用匯編編寫的游戲：我不知道有什麼商業游戲是完全用匯編開發的。不過有些游戲使用匯編完成多數對時間要求苛刻的部分。

資料：如果你正在找一門匯編語言的文檔，你主要要找晶元的文檔。網路上如Intel、AMD、Motorola等有一些關於它們的處理器的資料。對於書籍而言，《Assembly Language: Step-By-Step》是很值得學習的。

5、Pascal語言

Pascal語言是由Nicolas Wirth在七十年代早期設計的，因為他對於FORTRAN和COBOL沒有強制訓練學生的結構化編程感到很失望，「空心粉式代碼」變成了規范，而當時的語言又不反對它。Pascal被設計來強行使用結構化編程。最初的Pascal被嚴格設計成教學之用，最終，大量的擁護者促使它闖入了商業編程中。當Borland發布IBM PC上的 Turbo Pascal時，Pascal輝煌一時。集成的編輯器，閃電般的編譯器加上低廉的價格使之變得不可抵抗，Pascal編程了為MS-DOS編寫小程序的首選語言。

然而時日不久，C編譯器變得更快，並具有優秀的內置編輯器和調試器。Pascal在1990年Windows開始流行時走到了盡頭，Borland放棄了Pascal而把目光轉向了為Windows 編寫程序的C++。Turbo Pascal很快被人遺忘。

最後，在1996年，Borland發布了它的「Visual Basic殺手」— Delphi。它是一種快速的帶華麗用戶界面的 Pascal編譯器。由於不懈努力，它很快贏得了一大群愛好者。

基本上，Pascal比C簡單。雖然語法類似，它缺乏很多C有的簡潔操作符。這既是好事又是壞事。雖然很難寫出難以理解的「聰明」代碼，它同時也使得一些低級操作，如位操作變得困難起來。

優點：易學、平台相關的運行（Delphi）非常好。

缺點：「世界潮流」面向對象的Pascal繼承者（Mola、Oberon）尚未成功。語言標准不被編譯器開發者認同。專利權。

移植性：很差。語言的功能由於平台的轉變而轉變，沒有移植性工具包來處理平台相關的功能。

使用Pascal編寫的游戲：幾個。DirectX的Delphi組件使得游戲場所變大了。

資料：查找跟Delphi有關的資料，請訪問：Inprise Delphi page。

6、Visual Basic

哈，BASIC。回到八十年代的石器時代，它是程序初學者的第一個語言。最初的BASIC形式，雖然易於學習，卻是可怕的無組織化，它義無反顧的使用了GOTO充斥的「空心粉式代碼」。當回憶起BASIC的行號和GOSUB命令，沒有幾個人能止住眼角的淚水。

快速前進到九十年代早期，雖然不是蘋果公司所希望的巨人，HyperCard仍然是一個在Windows下無法比擬的吸引人的小型編程環境。Windows下的HyperCard克隆品如ToolBook又慢又笨又昂貴。為了與HyperCard一決高下，微軟取得了一個小巧的名為Thunder編程環境的許可權，並把它作為Visual Basci 1.0發布，其用戶界面在當時非常具有新意。這門語言雖然還叫做Basic（不再是全部大寫），但更加結構化了，行號也被去除。實際上，這門語言與那些內置於TRS-80、Apple II及Atari里的舊的ROM BASIC相比，更像是帶Basic風格動詞的Pascal。

經過六個版本，Visual Basic變得非常漂亮。用戶界面發生了許多變化，但依然保留著「把代碼關聯到用戶界面」的主旨。這使得它在與即時編譯結合時變成了一個快速原型的優異環境。

優點：整潔的編輯環境。易學、即時編譯導致簡單、迅速的原型。大量可用的插件。雖然有第三方的DirectX插件，DirectX 7已准備提供Visual Basic的支持。

缺點：程序很大，而且運行時需要幾個巨大的運行時動態連接庫。雖然表單型和對話框型的程序很容易完成，要編寫好的圖形程序卻比較難。調用Windows的API程序非常笨拙，因為VB的數據結構沒能很好的映射到C中。有OO功能，但卻不是完全的面向對象。專利權。

移植性：非常差。因為Visual Basic是微軟的產品，你自然就被局限在他們實現它的平台上。也就是說，你能得到的選擇是：Windows，Windows或Widnows。當然，有一些工具能將VB程序轉變成Java。

使用Visual Basic編寫的游戲：一些。有很多使用VB編寫的共享游戲，還有一些是商業性的。

資料：微軟的VB頁面有一些信息。

7、Java

Java是由Sun最初設計用於嵌入程序的可移植性「小C++」。在網頁上運行小程序的想法著實吸引了不少人的目光，於是，這門語言迅速崛起。事實證明，Java不僅僅適於在網頁上內嵌動畫 — 它是一門極好的完全的軟體編程的小語言。「虛擬機」機制、垃圾回收以及沒有指針等使它很容易實現不易崩潰且不會泄漏資源的可靠程序。

雖然不是C++的正式續篇，Java從C++ 中借用了大量的語法。它丟棄了很多C++的復雜功能，從而形成一門緊湊而易學的語言。不像C++，Java強制面向對象編程，要在Java里寫非面向對象的程序就像要在Pascal里寫「空心粉式代碼」一樣困難。

優點：二進制碼可移植到其他平台。程序可以在網頁中運行。內含的類庫非常標准且極其健壯。自動分配合垃圾回收避免程序中資源泄漏。網上數量巨大的代碼常式。

缺點：使用一個「虛擬機」來運行可移植的位元組碼而非本地機器碼，程序將比真正編譯器慢。有很多技術（例如「即時」編譯器）很大的提高了Java的速度，不過速度永遠比不過機器碼方案。早期的功能，如AWT沒經過慎重考慮，雖然被正式廢除，但為了保持向後兼容不得不保留。越高級的技術，造成處理低級的機器功能越困難，Sun為這門語言增加新的「受祝福」功能的速度實在太慢。

移植性：最好的，但仍未達到它本應達到的水平。低級代碼具有非常高的可移植性，但是，很多UI及新功能在某些平台上不穩定。

使用Java編寫的游戲：網頁上有大量小的Applet，但僅有一些是商業性的。有幾個商業游戲使用Java作為內部腳本語言。

資料：Sun的官方Java頁面有一些好的信息。IBM也有一個非常好的Java頁面。JavaLobby是一個關於Java新聞的最好去處。

8、創作工具

上面所提及的編程語言涵蓋了大多數的商業游戲。但是也有一個例外，這個大游戲由於它的缺席而變得突出。

「神秘島」。沒錯，賣得最好的商業游戲不是使用以上任何一門語言編的，雖然有人說「神秘島」99%是使用 3D建模工具製作的，其根本的編程邏輯是在HyperCard里完成的。

多數創作工具有點像Visual Basic，只是它們工作在更高的層次上。大多數工具使用一些拖拉式的流程圖來模擬流程式控制制。很多內置解釋的程序語言，但是這些語言都無法像上面所說的單獨的語言那樣健壯。

優點：快速原型 — 如果你的游戲符合工具製作的主旨，你或許能使你的游戲跑得比使用其他語言快。在很多情況下，你可以創造一個不需要任何代碼的簡單游戲。使用插件程序，如Shockware及IconAuthor播放器，你可以在網頁上發布很多創作工具生成的程序。

缺點：專利權，至於將增加什麼功能，你將受到工具製造者的支配。你必須考慮這些工具是否能滿足你游戲的需要，因為有很多事情是那些創作工具無法完成的。某些工具會產生臃腫得可怕的程序。

移植性：因為創作工具是具有專利權的，你的移植性以他們提供的功能息息相關。有些系統，如Director可以在幾種平台上創作和運行，有些工具則在某一平台上創作，在多種平台上運行，還有的是僅能在單一平台上創作和運行。

使用創作工具編寫的游戲：「神秘島」和其他一些同類型的探險游戲。所有的Shockwave游戲都在網路上。

資料：Director、HyperCard、SuperCard、IconAuthor、Authorware。

9、易語言

★全中文支持，無需跨越英語門檻。★全可視化編程，支持所見即所得程序界面設計和程序流程編碼。★中文語句快速錄入。提供多種內嵌專用輸入法，徹底解決中文語句輸入速度慢的問題。★代碼即文檔。自動規范強制代碼格式轉換，任何人編寫的任何程序源代碼格式均統一。★參數引導技術，方便程序語句參數錄入。★無定義類關鍵字。所有程序定義部分均採用表格填表方式，用戶無需記憶此類關鍵字及其使用格式。★命令格式統一。所有程序語句調用格式完全一致。★語法格式自動檢查。自動檢查並提示所輸入語句的語法格式是否正確，且可自動添加各類名稱。★全程提示與幫助。滑鼠停留立即顯示相關項目提示。編程時提示語法格式，調試時提示變數當前內容，隨時按下F1鍵可得到與當前主題相關詳細幫助等。★名稱自動管理。用戶修改任一名稱定義，其它所有包含該名稱的程序代碼均自動修正。★集成化開發環境。集界面設計、代碼編寫、調試分析、編譯打包等於一體。★學習資源豐富。詳細的幫助文件、數十兆的知識庫、數萬用戶的網上論壇、教材已出版發行……

10、結論

你可能希望得到一個關於「我該使用哪種語言」這個問題的更標準的結論。非常不幸，沒有一個對所有應用程序都最佳的解決方案。C適於快而小的程序，但不支持面向對象的編程。C++完全支持面向對象，但是非常復雜。Visual Basic與Delphi易學，但不可移植且有專利權。Java有很多簡潔的功能，但是慢。創作工具可以以最快的速度產生你的程序，但是僅對某一些類型的程序起作用。最好的方法是決定你要寫什麼樣的游戲，並選擇對你的游戲支持最好的語言。「試用三十天」的做法成為工業標準是件好事情。

⑹ 關於編譯器的產生

編譯器本身也是程序，通常也是C語言寫的，世界上第一個編譯器的部分內容肯定只能用機器碼寫。。。但機器碼建立的一些文本處理功後，自然就用這個功能處理宏文本來代替機器碼。。。當然第一台計算機能用一種文本語言來代替機器碼，自然可以用這個簡單的編譯器去編譯復雜的編譯器，一個復雜的去編譯更復雜的。。。。
當然最終結果就是C語言編譯器本身也會是C語言寫的，區別只是PC機的C語言編譯器，去編譯一個非PC機上運行的程序的
程序的編譯器。。。。即使編譯器編譯編譯器。。。比如java編譯器是C/C++寫的。。。還有現在的某款晶元的匯編編譯器，本身會是C/c++語言寫的，因為編譯器也是程序，當然可以用C語言編譯器去編譯一個匯編編譯器。。。只就是錘子可以做機器，當然機器也可以生產錘子。。。

⑺ 編譯原理的發展歷程

在20世紀40年代，由於馮·諾伊曼在存儲-程序計算機方面的先鋒作用，編寫一串代碼或程序已成必要，這樣計算機就可以執行所需的計算。開始時，這些程序都是用機器語言（machine language ）編寫的。機器語言就是表示機器實際操作的數字代碼，例如：
C7 06 0000 0002 表示在IBM PC 上使用的Intel 8x86處理器將數字2移至地址0 0 0 0 （16進制）的指令。
但編寫這樣的代碼是十分費時和乏味的，這種代碼形式很快就被匯編語言（assembly language ）代替了。在匯編語言中，都是以符號形式給出指令和存儲地址的。例如，匯編語言指令 MOV X,2 就與前面的機器指令等價（假設符號存儲地址X是0 0 0 0 ）。匯編程序（assembler ）將匯編語言的符號代碼和存儲地址翻譯成與機器語言相對應的數字代碼。
匯編語言大大提高了編程的速度和准確度，人們至今仍在使用著它，在編碼需要極快的速度和極高的簡潔程度時尤為如此。但是，匯編語言也有許多缺點：編寫起來也不容易，閱讀和理解很難；而且匯編語言的編寫嚴格依賴於特定的機器，所以為一台計算機編寫的代碼在應用於另一台計算機時必須完全重寫。
發展編程技術的下一個重要步驟就是以一個更類似於數學定義或自然語言的簡潔形式來編寫程序的操作，它應與任何機器都無關，而且也可由一個程序翻譯為可執行的代碼。例如，前面的匯編語言代碼可以寫成一個簡潔的與機器無關的形式 x = 2。
在1954年至1957年期間，IBM的John Backus帶領的一個研究小組對FORTRAN語言及其編譯器的開發，使得上面的擔憂不必要了。但是，由於當時處理中所涉及到的大多數程序設計語言的翻譯並不為人所掌握，所以這個項目的成功也伴隨著巨大的辛勞。幾乎與此同時，人們也在開發著第一個編譯器， Noam Chomsky開始了他的自然語言結構的研究。他的發現最終使得編譯器結構異常簡單，甚至還帶有了一些自動化。Chomsky的研究導致了根據語言文法（grammar ，指定其結構的規則）的難易程度以及識別它們所需的演算法來為語言分類。正如現在所稱的-與喬姆斯基分類結構（Chomsky hierarchy ）一樣-包括了文法的4個層次：0型、1型、2型和3型文法，且其中的每一個都是其前者的專門化。2型（或上下文無關文法（context-free grammar ））被證明是程序設計語言中最有用的，而且今天它已代表著程序設計語言結構的標准方式。
分析問題（ parsing problem ，用於限定上下文無關語言的識別的有效演算法）的研究是在20世紀60年代和70年代，它相當完善地解決了這一問題，現在它已是編譯理論的一個標准部分。它們與喬姆斯基的3型文法相對應。對它們的研究與喬姆斯基的研究幾乎同時開始，並且引出了表示程序設計語言的單詞（或稱為記號）的符號方式。
人們接著又深化了生成有效的目標代碼的方法，這就是最初的編譯器，它們被一直使用至今。人們通常將其誤稱為優化技術（optimization technique ），但因其從未真正地得到過被優化了的目標代碼而僅僅改進了它的有效性，因此實際上應稱作代碼改進技術（code improvement technique ）。
這些程序最初被稱為編譯程序-編譯器，但更確切地應稱為分析程序生成器（parser generator ），這是因為它們僅僅能夠自動處理編譯的一部分。這些程序中最著名的是 Yacc （yet another compiler- compiler），它是由Steve Johnson在1975年為Unix系統編寫的。
類似地，有窮自動機的研究也發展了另一種稱為掃描程序生成器（scanner generator ）的工具，Lex （與Yacc同時，由Mike Lesk為Unix系統開發的）是這其中的佼佼者。在20世紀70年代後期和80年代早期，大量的項目都關注於編譯器其他部分的生成自動化，這其中就包括代碼生成。這些嘗試並未取得多少成功，這大概是因為操作太復雜而人們又對其不甚了解。
編譯器設計最近的發展包括：首先，編譯器包括了更為復雜的演算法的應用程序，它用於推斷或簡化程序中的信息；這又與更為復雜的程序設計語言（可允許此類分析）的發展結合在一起。其中典型的有用於函數語言編譯的Hindle y - Milner類型檢查的統一演算法。
其次，編譯器已越來越成為基於窗口的交互開發環境（interactive development environment，IDE ）的一部分，它包括了編輯器、鏈接程序、調試程序以及項目管理程序。這樣的IDE的標准並沒有多少，但是已沿著這一方向對標準的窗口環境進行開發了。

⑻ 編譯器和開發環境的關系

談談程序設計語言、編譯器和開發環境之間的關系

許多初學者都會對這三個概念區分不清，應該說這三個概念是完全不同的，不能混為一談。在本文中，我就盡我最大的能力來講講這三個概念以及他們之間的關系。

首先說程序設計語言，它同人類的自然語言一樣也是一個語言，並且它是自然語言的一個子集。大家都知道自然語言是極其龐大和復雜的系統，具有很多不不確定性和不精確性，因此至今我們也沒有辦法對自然語言進行形式化的描述。程序設計語言只是自然語言的一個很小的子集，在計算機系統中，一切都是需要確定性和精確性的描述，因此程序設計語言也是極為規范的，在程序設計語言中，幾乎就不允許存在不確定性和不精確性，也就是說不能存在文法的二義性。這樣一個程序設計語言就可以通過一系列的產生式來進行形式化的描述，這一系列的產生式就被稱為文法，語言就是由文法來定義的。從另外一個角度來說，一個程序設計語言，它僅僅是一個語言，它只對程序進行形式上的要求。或者說，程序設計語言對應於編程中的編碼階段。我們有必要對程序開發的三個階段進行了解，程序開發從時間先後順序上可以分為三個階段：1.編碼階段，2.編譯階段，3.運行階段。在編碼階段，我們使用的就是程序設計語言。語言除了定義了文法以外，其他的任何事情他都不做。當然一種語言也有很多種版本，比如 BASIC 語言，就有很多種版本，C語言也是如此。這里所講的語言的版本與編譯器的版本是不一樣的。C語言的標准版本就是 ANSI C，如果初學者會提出這樣的問題「C語言哪個更好？」，這樣的問題反映出他們對語言與編譯器之間的關系的認識的不足。如果從語言的角度來講 VC 和 TC 是沒有多大區別的，他們基本上都能支持 ANSI C。

再來看看編譯器。編譯器與語言的關系就是，翻譯者與語言的關系。編譯器就是一個翻譯，他把使用某種語言書寫的源程序，翻譯成為等價的使用目標語言書寫的目標程序。前面我們也說了，語言是一個抽象的概念，是由文法來定義的。唯一實在的東西，也就是定義語言的文法。在使用語言時，我們只能說，使用這種語言去書寫一段程序。編譯器則是能夠將某種語言的源程序進行翻譯，然後生成目標程序。我們通常會說，某個編譯器支持了什麼語言，也就是說這個編譯器能識別並翻譯這種語言。現在的C編譯器，一般都是支持了 ANSI C 語言的，另外，編譯器的設計者可能還會對 ANSI C 進行一定的擴充，而且各個編譯器進行擴充功能都是不同的，因此可能就會出現一個編譯器誕生以後，就會出現一個新的語言的現象。TC 和 VC 就分別對 ANSI C 進行了不同的擴充，比如在 TC 中有 far 等關鍵字，ANSI C 中是沒有的，在 VC 中有內嵌匯編的語法 _asm，而在 TC 中則是使用 asm 關鍵字，這些內容在 ANSI C 中沒有的。編譯器的輸入時源程序，而其輸出則是目標程序。一般情況下，源程序是使用某種高級語言書寫的，而目標程序則是某個特定機器的機器語言程序。另一方面，編譯器除了提供編譯功能，還會提供一些運行庫。所謂運行庫就是由一些事先寫好的子程序所組成的子程序庫。例如C語言中的 printf 函數，就是由C的運行庫提供的。在 ANSI C 中定義了一些C語言的標准庫函數，這些庫函數是標准C必須具備的，也可以說這些庫函數成為了 ANSI C 的一個部分。另外，不同的編譯器還可以提供自己的，非標準的庫給用戶使用，在 TC 中的 Graphics 庫，其實就是由 TC 提供的，它不是屬於 ANSI C 的。簡單的說，編譯器是由編譯程序和運行庫組成的。在程序的編譯階段，就是使用編譯器對源程序進行編譯生成目標程序。

在程序的運行階段則是在一個特定的平台上，由這個平台來執行編譯生成的程序。Java 虛擬機是一個平台，DOS 和 Windows 也是平台，編譯器的作用就是溝通源程序和程序的運行平台。源程序相對於一個運行平台來說是不可識別的，但當編譯器將源程序編譯成為這個平台所能夠識別的目標語言以後，程序就可以在這個平台上運行了。

應該看到，編譯器在其中起到了很重要的作用。我們現在可以明確一些概念了，程序設計語言只是語言，它本身很難說有什麼好壞，這就如同說「漢語和英語哪個好」一樣。使用某一種程序設計語言，我們可以書寫自己的程序，從而向計算機表達自己希望完成的功能。這個階段，我們稱為編碼階段。編譯器由編譯程序和運行庫組成，編譯程序負責將源程序翻譯成為目標程序，運行庫提供了一些基本的子程序給程序編寫者使用。我們可以說編譯器是否支持某種語言，例如 TC 編譯器是支持 ANSI C 的，而 GCC 則是一個能夠支持多種語言的編譯器。然而不同的編譯器除了提供對某種語言的支持以外，還可能對該語言進行了某些功能擴充。編譯器在對語言的支持上，差別都是不太大的，這是因為許多語言都制定了一個標准，例如 ANSI C。編譯器的另外一個重要特性，就是對運行平台的支持。平台指的是一個程序運行所需要的所有軟體和硬體的基礎。編譯器對運行平台的支持，是通過將源程序編譯成為目標程序，以及編譯器所提供的運行庫來實現的。例如，TC只能將C源程序編譯生成，使用 80x86 CPU，操作系統為 DOS 的 16bit DOS 程序。VC只能將C源程序編譯生成 80x86 CPU、操作系統為 Windows 的 32bit Windows 程序。使用編譯器對源程序進行編譯被稱為編譯階段，這個階段編譯程序將源程序編譯為某個平台的目標代碼。程序在具體的平台上運行時，被稱為運行階段。應該指出，在編碼階段使用到的是程序設計語言，以及編譯器所提供的庫函數，這個階段產生的是源程序。在編譯階段使用的是源程序和編譯器，這個階段產生的是目標程序。在運行階段使用到的是目標程序和運行平台，這個時候產生的是程序運行結果。

因此說討論一個程序設計語言好壞沒有多大意義，因為他們使用的場合不同，比如匯編語言和 Java 語言，要談論這兩個語言的好壞是沒有實際意義的。而說「C語言哪個好」之類的話也是沒有意義的，我想大家學的C也就是在 ANSI C 基礎上的C，並且不同的C語言之間的差別是極小的。我們通常指的 TC、VC 都是指編譯器，而不是語言。編譯器能夠支持一種或者多種的程序設計語言，TC 能夠支持 ANSI C，VC 能夠支持 ANSI C 和 ANSI C++，而 GCC 則是一個支持多語言的編譯器。如果真要說 VC 比 TC 好，只能說 VC 編譯器提供的庫函數更多，並且 VC 能夠支持的平台是 Windows，而 VC 編譯出來的代碼也都是 32bit 的。

在以上概念中糾纏了這么久，我也不再想多說了。再來看開發環境。為了能夠方便程序設計者進行編碼、調試等工作，編譯器製造商在製作好一個編譯器以後，都會提供一個集成開發環境（又稱為IDE）。在這個 IDE 中，用戶可以完成編碼、編譯、調試、運行的全部工作。並且在最新的IDE中，可能還會提供一個可視化的設計功能，可以方便用戶進行程序界面的設計。例如 VB 等。另外一個方面，開發環境除了包括 IDE 以外，還包括了程序運行的平台。比如硬體是 IBM PC 兼容機，操作系統是 Windows 等。

可能，能講的也就這么多了，感覺講的並不是很好，不過我已經盡力了。有些東西是很難說清楚的，「只能意會不可言傳」指的就是這個了。不要怪我講的不好，還是自己用心去理解和體會吧。

⑼ 編譯器的發展史

編譯器
編譯器，是將便於人編寫，閱讀，維護的高級計算機語言翻譯為計算機能識別，運行的低級機器語言的程序。編譯器將源程序（Source program）作為輸入，翻譯產生使用目標語言（Target language）的等價程序。源程序一般為高級語言（High-level language），如Pascal，C++等，而目標語言則是匯編語言或目標機器的目標代碼（Object code），有時也稱作機器代碼（Machine code）。

一個現代編譯器的主要工作流程如下：

源程序（source code）→預處理器（preprocessor）→編譯器（compiler）→匯編程序（assembler）→目標程序（object code）→連接器（鏈接器，Linker）→可執行程序（executables）
目錄 [隱藏]
1 工作原理
2 編譯器種類
3 預處理器（preprocessor）
4 編譯器前端（frontend）
5 編譯器後端（backend）
6 編譯語言與解釋語言對比
7 歷史
8 參見

工作原理
翻譯是從源代碼（通常為高級語言）到能直接被計算機或虛擬機執行的目標代碼（通常為低級語言或機器言）。然而，也存在從低級語言到高級語言的編譯器，這類編譯器中用來從由高級語言生成的低級語言代碼重新生成高級語言代碼的又被叫做反編譯器。也有從一種高級語言生成另一種高級語言的編譯器，或者生成一種需要進一步處理的的中間代碼的編譯器（又叫級聯）。

典型的編譯器輸出是由包含入口點的名字和地址以及外部調用（到不在這個目標文件中的函數調用）的機器代碼所組成的目標文件。一組目標文件，不必是同一編譯器產生，但使用的編譯器必需採用同樣的輸出格式，可以鏈接在一起並生成可以由用戶直接執行的可執行程序。

編譯器種類
編譯器可以生成用來在與編譯器本身所在的計算機和操作系統（平台）相同的環境下運行的目標代碼，這種編譯器又叫做「本地」編譯器。另外，編譯器也可以生成用來在其它平台上運行的目標代碼，這種編譯器又叫做交叉編譯器。交叉編譯器在生成新的硬體平台時非常有用。「源碼到源碼編譯器」是指用一種高級語言作為輸入，輸出也是高級語言的編譯器。例如: 自動並行化編譯器經常採用一種高級語言作為輸入，轉換其中的代碼，並用並行代碼注釋對它進行注釋（如OpenMP）或者用語言構造進行注釋（如FORTRAN的DOALL指令）。

預處理器（preprocessor）
作用是通過代入預定義等程序段將源程序補充完整。

編譯器前端（frontend）
前端主要負責解析（parse）輸入的源程序，由詞法分析器和語法分析器協同工作。詞法分析器負責把源程序中的『單詞』（Token）找出來,語法分析器把這些分散的單詞按預先定義好的語法組裝成有意義的表達式，語句，函數等等。例如「a = b + c;」前端詞法分析器看到的是「a, =, b , +, c;」，語法分析器按定義的語法，先把他們組裝成表達式「b + c」，再組裝成「a = b + c」的語句。前端還負責語義（semantic checking）的檢查，例如檢測參與運算的變數是否是同一類型的，簡單的錯誤處理。最終的結果常常是一個抽象的語法樹（abstract syntax tree，或 AST），這樣後端可以在此基礎上進一步優化，處理。

編譯器後端（backend）
編譯器後端主要負責分析，優化中間代碼（Intermediate representation）以及生成機器代碼（Code Generation）。

一般說來所有的編譯器分析，優化，變型都可以分成兩大類：函數內（intraproceral）還是函數之間（interproceral）進行。很明顯，函數間的分析，優化更准確，但需要更長的時間來完成。

編譯器分析（compiler analysis）的對象是前端生成並傳遞過來的中間代碼，現代的優化型編譯器（optimizing compiler）常常用好幾種層次的中間代碼來表示程序，高層的中間代碼（high level IR）接近輸入的源程序的格式，與輸入語言相關（language dependent），包含更多的全局性的信息，和源程序的結構；中層的中間代碼（middle level IR）與輸入語言無關，低層的中間代碼(Low level IR)與機器語言類似。不同的分析，優化發生在最適合的那一層中間代碼上。

常見的編譯分析有函數調用樹（call tree），控制流程圖（Control flow graph），以及在此基礎上的變數定義－使用，使用－定義鏈（define-use/use-define or u-d/d-u chain），變數別名分析（alias analysis），指針分析（pointer analysis），數據依賴分析（data dependence analysis）等等。

上述的程序分析結果是編譯器優化（compiler optimization）和程序變形（compiler transformation）的前提條件。常見的優化和變新有：函數內嵌（inlining），無用代碼刪除（Dead code elimination），標准化循環結構（loop normalization），循環體展開（loop unrolling），循環體合並，分裂（loop fusion，loop fission），數組填充（array padding），等等。優化和變形的目的是減少代碼的長度，提高內存（memory），緩存（cache）的使用率，減少讀寫磁碟，訪問網路數據的頻率。更高級的優化甚至可以把序列化的代碼（serial code）變成並行運算，多線程的代碼（parallelized，multi-threaded code）。

機器代碼的生成是優化變型後的中間代碼轉換成機器指令的過程。現代編譯器主要採用生成匯編代碼（assembly code）的策略，而不直接生成二進制的目標代碼（binary object code）。即使在代碼生成階段，高級編譯器仍然要做很多分析，優化，變形的工作。例如如何分配寄存器（register allocatioin），如何選擇合適的機器指令（instruction selection），如何合並幾句代碼成一句等等。

編譯語言與解釋語言對比
許多人將高級程序語言分為兩類: 編譯型語言和解釋型語言。然而，實際上，這些語言中的大多數既可用編譯型實現也可用解釋型實現，分類實際上反映的是那種語言常見的實現方式。（但是，某些解釋型語言，很難用編譯型實現。比如那些允許在線代碼更改的解釋型語言。）

歷史
上世紀50年代，IBM的John Backus帶領一個研究小組對FORTRAN語言及其編譯器進行開發。但由於當時人們對編譯理論了解不多，開發工作變得既復雜又艱苦。與此同時，Noam Chomsky開始了他對自然語言結構的研究。他的發現最終使得編譯器的結構異常簡單，甚至還帶有了一些自動化。Chomsky的研究導致了根據語言文法的難易程度以及識別它們所需要的演算法來對語言分類。正如現在所稱的Chomsky架構（Chomsky Hierarchy），它包括了文法的四個層次：0型文法、1型文法、2型文法和3型文法，且其中的每一個都是其前者的特殊情況。2型文法（或上下文無關文法）被證明是程序設計語言中最有用的，而且今天它已代表著程序設計語言結構的標准方式。分析問題（parsing problem，用於上下文無關文法識別的有效演算法）的研究是在60年代和70年代，它相當完善的解決了這個問題。現在它已是編譯原理中的一個標准部分。

有限狀態自動機（Finite Automaton）和正則表達式（Regular Expression）同上下文無關文法緊密相關，它們與Chomsky的3型文法相對應。對它們的研究與Chomsky的研究幾乎同時開始，並且引出了表示程序設計語言的單詞的符號方式。

人們接著又深化了生成有效目標代碼的方法，這就是最初的編譯器，它們被一直使用至今。人們通常將其稱為優化技術（Optimization Technique），但因其從未真正地得到過被優化了的目標代碼而僅僅改進了它的有效性，因此實際上應稱作代碼改進技術（Code Improvement Technique）。

當分析問題變得好懂起來時，人們就在開發程序上花費了很大的功夫來研究這一部分的編譯器自動構造。這些程序最初被稱為編譯器的編譯器（Compiler-compiler），但更確切地應稱為分析程序生成器（Parser Generator），這是因為它們僅僅能夠自動處理編譯的一部分。這些程序中最著名的是Yacc（Yet Another Compiler-compiler），它是由Steve Johnson在1975年為Unix系統編寫的。類似的，有限狀態自動機的研究也發展了一種稱為掃描程序生成器（Scanner Generator）的工具，Lex（與Yacc同時，由Mike Lesk為Unix系統開發）是這其中的佼佼者。

在70年代後期和80年代早期，大量的項目都貫注於編譯器其它部分的生成自動化，這其中就包括了代碼生成。這些嘗試並未取得多少成功，這大概是因為操作太復雜而人們又對其不甚了解。

編譯器設計最近的發展包括：首先，編譯器包括了更加復雜演算法的應用程序它用於推斷或簡化程序中的信息；這又與更為復雜的程序設計語言的發展結合在一起。其中典型的有用於函數語言編譯的Hindley-Milner類型檢查的統一演算法。其次，編譯器已越來越成為基於窗口的交互開發環境（Interactive Development Environment，IDE）的一部分，它包括了編輯器、連接程序、調試程序以及項目管理程序。這樣的IDE標准並沒有多少，但是對標準的窗口環境進行開發已成為方向。另一方面，盡管近年來在編譯原理領域進行了大量的研究，但是基本的編譯器設計原理在近20年中都沒有多大的改變，它現在正迅速地成為計算機科學課程中的中心環節。

在九十年代，作為GNU項目或其它開放源代碼項目的一部分，許多免費編譯器和編譯器開發工具被開發出來。這些工具可用來編譯所有的計算機程序語言。它們中的一些項目被認為是高質量的，而且對現代編譯理論感性趣的人可以很容易的得到它們的免費源代碼。

大約在1999年，SGI公布了他們的一個工業化的並行化優化編譯器Pro64的源代碼，後被全世界多個編譯器研究小組用來做研究平台，並命名為Open64。Open64的設計結構好，分析優化全面，是編譯器高級研究的理想平台。

編譯器是一種特殊的程序，它可以把以特定編程語言寫成的程序變為機器可以運行的機器碼。我們把一個程序寫好，這時我們利用的環境是文本編輯器。這時我程序把程序稱為源程序。在此以後程序員可以運行相應的編譯器，通過指定需要編譯的文件的名稱就可以把相應的源文件（通過一個復雜的過程）轉化為機器碼了。

編譯器工作方法
首先編譯器進行語法分析，也就是要把那些字元串分離出來。然後進行語義分析，就是把各個由語法分析分析出的語法單元的意義搞清楚。最後生成的是目標文件，我們也稱為obj文件。再經過鏈接器的鏈接就可以生成最後的可執行代碼了。有些時候我們需要把多個文件產生的目標文件進行鏈接，產生最後的代碼。我們把一過程稱為交叉鏈接。

⑽ c語言編譯器是什麼東西

首先你要明白編譯的意思，它是指把高級語言翻譯成計算機
能讀懂的低級語言（二進制代碼），這樣計算機才會執行你
的命令，編譯器就相當於一個翻譯，在翻譯的過程中還會檢
查你語法上有沒有錯誤
C語言編譯器自然是把用C語言寫的程序翻譯成二進制代碼咯
【原創答人】

導航:首頁 > 源碼編譯 > 自然語言處理編譯器

自然語言處理編譯器

與自然語言處理編譯器相關的資料