聰明的人類發(fā)現(xiàn)把簡單的開關(guān)組合起來可以表達復(fù)雜的bool邏輯,在此基礎(chǔ)之上構(gòu)建了 CPU ,因此 CPU 只能簡單的理解開關(guān),用數(shù)字表達就是0和1。
CPU 相當原始,就像單細胞生物一樣,只能把數(shù)據(jù)從一個地方搬到另一個地方、簡單的加一下,沒有任何高難度動作,這些操作雖然看上去很簡單很笨,但 CPU 有一個無與倫比的優(yōu)勢,那就是一個字:快,這是人類比不了了的,CPU 出現(xiàn)后人類開始擁有第二個大腦。就是這樣原始的一個物種開始支配起另一個叫做程序員的物種。
一般來說兩個不同的物種要想交流,比如人和鳥,就會有兩種方式:要不就是鳥說人話,讓人聽懂;要不就是人說鳥語,讓鳥聽懂;就看誰厲害了。最開始 CPU 勝出,程序員開始說鳥語并認真感受 CPU 的支配地位,好讓 CPU 大爺可以工作,感受一下最開始的程序員是怎么說鳥語的:程序員按照 CPU 的旨意直接用0和1編寫指令,你沒有看錯,這破玩意就是代碼了,就是這么原生態(tài),然后放到打孔紙帶上輸入給CPU,CPU 開始工作,這時的程序可真的是看得見摸得著,就是有點浪費紙。
這時程序員必須站在 CPU 的角度來寫代碼,畫風(fēng)是這樣的:
乍一看你知道這是什么意思嗎?你不知道,心想:“這是什么破玩意?”,但 CPU 知道,心想“這就簡直就是世界上最美的語言”。
終于有一天程序員受夠了說鳥語,好歹也是靈長類,嘰嘰喳喳說鳥語太沒面子,你被委以重任:讓程序員說人話。你沒有苦其心志勞其筋骨,而是仔細研究了一下 CPU,發(fā)現(xiàn) CPU 執(zhí)行的指令集來來回回就那么幾個指令,比如加法指令、跳轉(zhuǎn)指令等等,因此你把機器指令和對應(yīng)的具體操作做了一個簡單的映射,把機器指令映射到人類能看懂的單詞,這樣上面的01串就變成了:
這樣,程序員不必生硬的記住1011.....,而是記住人類可以認識的ADD SUB MUL DIV等這樣的單詞即可。
匯編語言就這樣誕生了,編程語言中首次出現(xiàn)了人類可以認識的東西。
這時程序員終于不用再“嘰嘰喳喳。?!?,而是升級為“阿巴阿巴。。”,雖然人類認知“阿巴阿巴”這幾個字,但這和人類的語言在形式上差別還是有點大。
盡管匯編語言已經(jīng)有人類可以認識的單詞,但匯編語言和機器語言一樣都屬于低級語言。所謂低級語言是說你需要關(guān)心所有細節(jié)。關(guān)心什么細節(jié)呢?我們說過,CPU 是非常原始的東西,只知道把數(shù)據(jù)從一個地方搬到另一個地方,簡單的操作一下再從一個地方搬到另一地方。因此,如果你想用低級語言來編程的話,你需要使用多個“把數(shù)據(jù)從一個地方搬到另一個地方,簡單的操作一下再從一個地方搬到另一地方”這樣的簡單指令來實現(xiàn)諸如排序這樣復(fù)雜的問題。有的同學(xué)可能對此感觸不深,這就好比,本來你想表達“去給我端杯水過來”:如果你用匯編這種低級語言就得這樣實現(xiàn):
CPU 實在太簡單了,簡單到不能了理解任何稍微抽象一點諸如“給我端杯水”這樣的東西,但人類天生習(xí)慣抽象化的表達,人類和機器的差距有辦法來彌補嗎?換句話說就是有沒有一種辦法可以自動把人類抽象的表達轉(zhuǎn)為 CPU 可以理解的具體實現(xiàn),這顯然可以極大增強程序員的生產(chǎn)力,現(xiàn)在,這個問題需要你來解決。
思來想去你都不知道該怎么把人類的抽象自動轉(zhuǎn)為 CPU 能理解的具體實現(xiàn),就在要放棄的時候你又看了一眼 CPU 可以理解的一堆細節(jié):電光火石之間靈光乍現(xiàn),你發(fā)現(xiàn)了滿滿的套路,或者說模式。大部分情況下 CPU 執(zhí)行的指令平鋪直敘的,就像這樣:這些都是告訴 CPU 完成某個特定動作,你給這些平鋪直敘的指令起了個名字,姑且就叫陳述句吧,statement。
除此之外,你還發(fā)現(xiàn)了這樣的套路,那就是需要根據(jù)某種特定狀態(tài)決定走哪段指令,這個套路在人看來就是“如果。。。就。。。否則。。就。。。”:
在某些情況下還需要不斷重復(fù)一些指令,這個套路看起來就是原地打轉(zhuǎn):
最后就是這里有很多看起來差不多的指令,就像這里:
這些指令是重復(fù)的,只是個別細節(jié)有所差異,把這些差異提取出來,剩下的指令打包到一起,用一個代號來指定這些指令就好了,這要有個名字,就叫函數(shù)吧:
現(xiàn)在你發(fā)現(xiàn)了所有套路:// 條件轉(zhuǎn)移
if ***
blablabla
else ***
blablabla
// 循環(huán)
while ***
blablabla
// 函數(shù)
func abc:
blablabla
這些相比匯編語言已經(jīng)有了質(zhì)的飛躍,因為這已經(jīng)和人類的語言非常接近了。接下來你發(fā)現(xiàn)自己面臨兩個問題:
- 該怎樣把上面的人類可以認識的字符串轉(zhuǎn)換為 CPU 可以認識的機器指令
你想起來了,上文說過大部分代碼都是平鋪直敘的陳述句,statement,這里的blablabla 僅僅就是一堆陳述句嗎?顯然不是,blablabla 可以是陳述句,當然也可以是條件轉(zhuǎn)移if else,也可以是循環(huán)while,也可以是調(diào)用函數(shù),這樣才合理。雖然這樣合理,很快你就發(fā)現(xiàn)了另一個嚴重的問題:blabalbla中可以包含 if else 等語句,而if else等語句中又可以包含blablabla,blablabla中反過來又雙可能會包含if else等語句,if else等語句又雙叒有可能會包含blablabla,blablabla又雙叒叕可能會包含if else等語句。。。就像盜夢空間一樣,一層夢中還有一層夢,夢中之夢,夢中之夢中之夢。。。一層嵌套一層,子子孫孫無窮匱也。。。此時你已經(jīng)明顯感覺腦細胞不夠用了,這也太復(fù)雜了吧,絕望開始吞噬你,上帝以及老天爺啊,誰來救救我!
此時你的高中老師過來拍了拍你的肩膀,遞給了你一本高中數(shù)學(xué)課本,你惱羞成怒,給我這破玩意干什么,我現(xiàn)在想的問題這么高深,豈是一本破高中數(shù)學(xué)能解決的了的,抓過來一把扔在了地上。此時一陣妖風(fēng)吹過,教材停留在了這樣一頁,上面有這樣一個數(shù)列表達:這個遞歸公式在表達什么呢?f(x)的值依賴f(x-1),f(x-1)的值又依賴f(x-2),f(x-2)的值又依賴。。。一層嵌套一層,夢中之夢,if中嵌套 statement,statement 又可以嵌套if。。。
等一下,這不就是遞歸嘛,上面看似無窮無盡的嵌套也可以用遞歸表達啊!你的數(shù)學(xué)老師仰天大笑,too young too simple,留下羞愧的你佛手而去,看似高科技的東西竟然用高中數(shù)學(xué)就解決了,一時震驚的目瞪狗帶不知所措無地自容。有了遞歸這個概念加持,聰明的智商又開始占領(lǐng)高地了。
不就是嵌套嘛,一層套一層嘛,遞歸天生就是來表達這玩意的 (提示:這里的表達并不完備,真實的編程語言不會這么簡單):if : if bool statement else statementfor: while bool statementstatement: if | for | statement
上面一層嵌套一層的盜夢空間原來可以這么簡潔的幾句表達出來啊,你給這幾句表達起了高端的名字,語法。數(shù)學(xué),就是可以讓一切都變得這么優(yōu)雅。世界上所有的代碼,不管有多么復(fù)雜最終都可以歸結(jié)到語法上,原因也很簡單,所有的代碼都是按照語法的形式寫出來的嘛。至此,你發(fā)明了真正的人類可以認識的編程語言。之前提到的第一個問題解決了,但僅僅有語言還是不夠的。
現(xiàn)在還差一個問題,怎樣才能把這語言最終轉(zhuǎn)化為 CPU 可以認識的機器指令呢?人類可以按照語法寫出代碼,這些代碼其實就是一串字符,怎么讓計算機也能認識用遞歸語法表達的一串字符呢?這是一項事關(guān)人類命運的事情,你不禁感到責(zé)任重大,但這最后一步又看似困難重重,你不禁仰天長嘆,計算機可太難了。此時你的初中老師過來拍了拍你的肩膀,遞給了你一本初中植物學(xué)課本,你惱羞成怒,給我這破玩意干什么,我現(xiàn)在想的問題這么高深,豈是一本破初中教科書能解決的了的,抓過來一把扔在了地上。此時又一陣妖風(fēng)掛過,書被翻到了介紹樹的一章,你望著這一頁不禁發(fā)起呆來:樹干下面是樹枝,樹枝下是樹葉,樹枝下也可以是樹枝,樹枝下還可以是樹枝、吃葡萄不吐葡萄皮,不吃葡萄倒吐葡萄皮,哎?這句不對,回到上面這句,樹干生樹枝,樹枝還可以生樹枝,一層套一層、夢中之夢、子子孫孫無窮匱、高中數(shù)學(xué)老師,等一下,這也是遞歸?。。?!我們可以把根據(jù)遞歸語法寫出來的的代碼用樹來表示啊!
你的初中老師仰天大笑,圖樣圖森破,看似高科技的東西竟然靠初中知識就解決了。
計算機處理編程語言時可以按照遞歸定義把代碼用樹的形式組織起來,由于這棵樹是按照語法生成的,姑且就叫語法樹吧。現(xiàn)在代碼被表示成了樹的形式,你仔細觀察后發(fā)現(xiàn),其實葉子節(jié)點的表達是非常簡單的,可以很簡單的翻譯成對應(yīng)的機器指令,只要葉子節(jié)點翻譯成了機器指令,你就可以把此結(jié)果應(yīng)用到葉子節(jié)點的父節(jié)點,父節(jié)點又可以把翻譯結(jié)果引用到父節(jié)點的父節(jié)點,一層層向上傳遞,最終整顆樹都可以翻譯成具體的機器指令。完成這個工作的程序也要有個名字,根據(jù)“弄不懂原則”,你給這個類似翻譯的程序起了個不怎么響亮的名字,編譯器,compiler。
現(xiàn)在你還覺得二叉樹之類的數(shù)據(jù)結(jié)構(gòu)沒啥用嗎?至此,你完成了一項了不起的發(fā)明創(chuàng)造,程序員可以用人類認識的東西來寫代碼,你編寫的一個叫做編譯器的程序負責(zé)將其翻譯成 CPU 可以認識的機器指令。后人根據(jù)你的思想構(gòu)建出了C/C++、以及后續(xù)的Java、Python,這些語言現(xiàn)在還有一幫人在用呢。
世界上所有的編程語言都是遵照特定語法來編寫的,編譯器根據(jù)該語言的語法將代碼解析成語法樹,遍歷語法樹生成機器指令(C/C++)或者字節(jié)碼等(Java),然后交給 CPU(或者虛擬機)來執(zhí)行。也因此,高級語言的抽象表達能力很強,代價都是犧牲了對底層的控制能力,這就是為什么操作系統(tǒng)的一部分需要使用匯編語言編寫,匯編語言對底層細節(jié)的強大控制力是高級語言替代不了的。最后請注意,本文為通俗易懂講解編程語言犧牲了嚴謹性,這里的語法沒有體現(xiàn)函數(shù)、表達式等等,真實語言的語法遠遠比這里的復(fù)雜,此外關(guān)于編譯器也不會直接把語法樹翻譯成機器語言,而是生成一種類似機器指令的中間語言,經(jīng)過一系列復(fù)雜的優(yōu)化后最終生成真正的機器指令,真實的編譯器遠比這里復(fù)雜。