思考函數編程(2)好用、又無副作用的函數編程

只要遵守函數編程（FP）的原則，管他用什麼語言，都可以進行FP。你可以用非函數式的語言（例如Java），進行FP；正如同你可以用非物件導向的語言（例如C），進行OOP（物件導向編程）一樣。但是只有想不開的人才會這麼做，畢竟這麼做是事倍功半。

1960年代左右，LISP誕生，被視為第一個函數式語言，從此越來越多函數式語言隨之出現。不過，畢竟Lambda Calculus是讓虛幻不存在的機器執行的，沒有受到真實世界的限制，所以真實世界的函數式語言雖然都是源自於Lambda Calculus，但卻都和Lambda Calculus之間有所差異。

由於FP只是一些構想觀念，各種語言實踐FP的作法也可能有所不同，但是大致上來說，FP的共同點在於：「沒有副作用」（Side Effect）、「第一級函數」（First-Class Function）。前者是指在表示式（Expression）內不可以造成值的改變；後者是指函數被當作一般值對待，而不是次級公民，可當作「傳入參數」或「傳出結果」。

FP和我們慣用的程式編寫風格，有相當大的差異。Imperative Programming（命令式編程）認為程式的執行，就是一連串狀態的改變；但FP則將程式的運作，視為數學函數的計算，並且避免「狀態」和「可變資料」。但是，沒有狀態、沒有可變資料，程式要如何運作呢？事實上，FP使用函數，而函數可以「自動」幫我們保存資料。Imperative Programming的資料大量放在heap中；但FP則是放在堆疊（tack）內（或者由堆疊指向heap）。

在討論FP時，也常常會談到遞迴（Recursion）。為何遞迴對於FP相當重要？因為遞迴可以用來保存狀態。以費伯納西數列（1, 1, 2, 3, 5, 8, 13……）來說，每個值是前兩個值的和，想製造出費伯納西數列，Imperative編程的作法會用迴圈，而FP的作法則會用遞迴。

遞迴可以保存狀態，讓程式變得相當精簡，但是成本（時間與記憶體）也很高。所以，許多時候，函數式語言會希望我們將程式寫成尾端遞迴（Tail Recursion），以便編譯器自動將它編譯成記憶體的直接跳躍（也就是迴圈）。

為了提升效率，許多函數式語言會納入Imperative的某些作法（例如允許副作用），這類的FPL被稱為不純（Impure）的函數式編程語言，例如Ocaml、F#、LISP、REBOL。當然也有語言堅持Pure Functional的作法，例如Erlang、Haskell、Occam、Oz。

以往純的函數式語言會被某些人認為「不食人間煙火」，而不純的函數式語言，則被認為比較實際、實用，但是最近大家的看法似乎有了改變，因為以Erlang為首的純函數式語言，似乎更能充分展現出FP的優勢。

但是，除了可以標新立異當作IT上流社會炫耀的表徵之外，究竟採用FP有何優勢？

首先，單元測試（Unit）會變得相當容易。對OOP來說，單元測試是以類別為單元，這種單元其實不小，而且要測試完整也不見得很容易；對於FP來說，函數是單元測試的單位，因為函數不可以有副作用，所以對於函數來說，我們要注意的只有輸入（引數）和輸出（傳出值），且傳出值只受到引數的影響。這使得單元測試相當容易，只需確認引數的結果是否正確，而不需要管函數呼叫的次序或者外部狀態是否做好正確的設定。

但如果是C、Java或C#這類語言，只檢查函數的傳出值是不夠的，因為函數執行過程中可能會改變外部狀態。但是對於FP來說，就不用擔心這一點。

想除錯，就必須能讓此錯誤可以重現（Reproduce），然後定位（Locate）錯誤的地方。對FP來說，由於沒有外部狀態的因素干擾，所以上述這兩點都相當容易做到，能讓出錯函數無所遁形。舉例來說，Erlang的某個函數只要會出錯，就一定每次都會出錯，所以可以「重現」；但C語言的某個函數一旦出錯，卻不見得每次都出錯，相當麻煩。一旦知道某個函數出錯，你可以快速地在Erlang函數內找出問題所在，而予以修正；但是對C語言來說，由於外部狀態影響太多，除錯變成一件麻煩的工作。

另外，FP也相當適合寫共時（Concurrency）的程式。沒有共享記憶體、沒有執行緒，不需要擔心Critical Section，不必使用Mutex等上鎖機制。由於沒有外部狀態的問題，FP的程式也相當適合進行程式碼「熱抽換」或「熱部署」（Hot Code Deployment）──你可以不需要關閉軟體系統，直接部署新的程式模組。（未完待續）

作者簡介：
蔡學鏞－技術顧問
清華大學資訊工程碩士，曾任華碩集團軟體工程師、元智大學資訊系講師、美商歐萊禮出版社技術編輯、臺灣微軟特約專欄作家。

熱門新聞