Categories
程式開發

Python 之父為什麼嫌棄lambda 匿名函數?


Python 支持lambda 匿名函數,其擴展的BNF 表示法是lambda_expr ::= “lambda” [parameter_list] “:” expression ,也就是lambda 參數序列:表達式。

這是一種便捷的函數定義方式,若翻譯成我們熟知的函數形式,會是這個樣子:

def (parameter_list):
return expression

也就是說,Python 中的lambda 函數是一種可接收多個參數的函數,返回值是一個表達式。

它最大的好處是單行簡潔,不需要函數命名與換行縮進。

不得不說,匿名函數有時候是挺好用的,比如下文會介紹到的一些常見用法,它因此受到了不少人的推崇。

但是,匿名函數通常也會造成代碼難以閱讀,容易被人濫用,再加上Python 只提供了對它的“殘疾的”支持,所以又有一些觀點不建議使用匿名函數。

事實上,Python 之父Guido van Rossum 就屬於“不推薦使用派”,他甚至曾經(2005年)想要移除lambda,只不過最後妥協了。

Python 之父為什麼嫌棄lambda 匿名函數? 1

出處:https://www.artima.com/weblogs/viewpost.jsp?thread=98196

lambda 這一個由其他開發者貢獻進來的特性(借鑒自lisp 語言),存在了十多年,但是卻被這門語言的創造者(兼首席設計師)所嫌棄,最後竟然還奇蹟般地倖存了下來,對於這個故事,大家是否覺得挺有戲劇性的?

接下來,本文就仔細聊一聊這個處境尷尬卻生命力頑強的lambda 匿名函數吧!

1、lambda 怎麼使用?

lambda 函數通常的用法是結合map()、reduce()、filter()、sorted() 等函數一起使用,這些函數的共性是:都可以接收其它函數作為參數。

例如下面的幾個例子:

my_list = [3, 1, 5, 4, 10]

# 元素全加1,结果:[4, 2, 6, 5, 11]
list(map(lambda i:i+1, my_list))

# 过滤小于10的元素,结果:[3, 1, 5, 4]
list(filter(lambda i:i<10, my_list)) # 元素累加,结果:33 from functools import reduce reduce(lambda i,j:i+j, my_list, 10) # 字典按值排序,结果:[('b', 1), ('a', 3), ('d', 4), ('c', 5)] my_dict = {'a':3, 'b':1, 'c':5, 'd':4} sorted(my_dict.items(), key=lambda item:item[1])

初學者也許會覺得代碼讀不懂,但是只要記住“Python中的函數是一等公民”,知道一個函數可以被作為另一個函數的參數或者返回值,就容易理解了。

比如對於map() 函數的例子,你可以理解成這個形式:

my_func = lambda i:i+1
list(map(my_func, my_list))

甚至可以還原成普通的函數:

def add_one(i):
return i+1

list(map(add_one, my_list))

map() 函數的第一個參數是一個函數,第二個參數是一個可迭代對象。 這第一個參數會迭代地調用第二個參數中的元素,調用的結果以迭代器的形式返回。

這個例子使用了list(),是為了方便一次性取出迭代器中的元素,直觀地展示出來,在實際使用中,很可能會是基於迭代器的形式。

由這幾種用法,我們可以總結出lambda 函數的使用規律:

它出現在需要使用函數的地方它適合實現簡單的功能它是一次性的用途,不能在其它地方復用它一般不會被獨立使用,總是作為其它函數的一部分

2、lambda 有什麼問題?

由上面的用法可以看出,使用lambda 函數的代碼比較緊湊簡潔,所以有人稱它體現了“Pythonic”的優雅思想。

但是,lambda 函數有沒有什麼缺陷呢?

有! 當前的lambda 函數有一個最大的問題,即只支持單行表達式,無法實現豐富的功能,例如無法在函數創建時使用語句(statement),無法使用if-else 的判斷條件,也無法使用try-except的異常捕獲機制,等等。

這極大地限制了它的能力,導致了它被人詬病為“殘疾的”。

從技術實現的角度上看, 這個問題可以通過語法層面的設計來解決。

在當年的郵件組討論中,有人提出過一些解決思路,比如這封郵件:

Python 之父為什麼嫌棄lambda 匿名函數? 2

出處:https://mail.python.org/pipermail/python-dev/2006-February/060654.html

它提出了一個lambda args::suite 的想法,支持寫成這樣的形式:

ss = sorted(seq, key=(lambda x::
try: return abs(x)
except TypeError: return 0))

但是,Guido 很快就否決了這個思路。

他寫了一篇文章《Language Design Is Not Just Solving Puzzles》來回應:

Python 之父為什麼嫌棄lambda 匿名函數? 3

出處:https://www.artima.com/weblogs/viewpost.jsp?thread=147358

其基本觀點是:不能光顧著解決一個問題/實現某種功能,就引入缺乏“Pythonicity”的語言設計。

那麼,為什麼Guido 會認為這是一種不好的設計呢?

我試著概括一下,理由是:

雙冒號“::”憑空在此引入,但是跟切片語法中的“::”完全不同,而且跟C++/Perl 中的作用域操作符用法也不同即使不用雙冒號,用其它符號表示(比如單冒號),還是難以接受,因為都會在一個表達式中嵌入縮進代碼塊。 這就跟使用花括號和begin/end 關鍵字來作語句分組(statement grouping)一樣,都令人難以接受在lambda 中實現其它功能並不重要,這還會讓解析器變得複雜(需區分是否有縮進、記錄縮進級別),顯得小題大做了

簡而言之,他認為簡潔友好的用戶體驗更為重要,如果簡潔的語法無法滿足需求,就應該寫成具名函數的形式,而非設計出複雜的匿名函數。

3、為什麼Guido 想移除lambda?

上文提到的多行lambda 語句(multi-statement lambda)事件發生在2006 年,我們看到了Guido 不想給lambda 引入複雜設計的原因。

但是,早在2005 年,Guido 就曾經想要從Python 移除lambda,他對它的“嫌棄”是一個“歷史悠久”的傳統……

在《The fate of reduce() in Python 3000》這篇短文中,Guido 提出要一次性移除reduce()、map()、filter() 以及lambda。

移除lambda 的理由如下:

對於不熟悉Lisp 或Scheme 的用戶,lambda 這名字容易造成混淆很多人誤以為匿名函數能做嵌套函數不能做的事,但其實並無區別;存在lambda,就會造成不必要的選擇,減少選擇,可以簡化思維移除reduce()、map() 和filter() 後,就沒必要寫簡短的局部函數了

回顧一下我們在前文中總結出的lambda 的4 條使用規律,可以發現它跟幾個高階函數(可以接收其它函數作為參數的函數)有較強的“寄生關係”,如果它們能移除了的話,lambda 確實就沒有什麼獨立存留的意義了。

那麼,為什麼Guido 覺得應該移除那幾個高階函數呢?

主要的理由有:

可以替換成更加清晰的列表解析式或者生成器表​​達式,例如filter(P,S) 可以寫成 [x for x in S if P(x)],map(F, S) 寫成 [F(x) for x in S]至於reduce(),他說這是最討厭的,除了涉及+ 和* 的少數用法,其它時候他總要拿出紙筆來畫圖解才能搞清楚。 除了顯式地寫循環,他還針對reduce() 的幾種用法而提出了幾個替代用法,包括引入新的any() 和all() 函數

總體而言,Guido 的想法暗合了《The Zen of Python》中的這一條:There should be one-- and preferably only one --obvious way to do it。

但是回到現實,為了照顧某些人的習慣,以及對兼容性的考慮,Guido 最後保守地放棄了“清理異端”的計劃。

因此,lambda 得以從Python 最高獨裁者的手上死裡逃生。 直到一年後,它試圖興風作浪(多行表達式),卻慘遭鎮壓。

我彷佛聽到了Guido 的內心OS:當初我想刪除東西的時候,你們百般阻撓,現在你們想添加東西,哼,沒門! ……

Python 之父為什麼嫌棄lambda 匿名函數? 4

哈哈,開了個玩笑。

Guido 的所有決定都體現了他的Pythonic 設計美學、自恰的邏輯一致性以及對社區聲音的權衡。

對於lambda,我認可他的觀點,而通過回溯語法發展的歷史,我覺得自己對於Python 的理解變得更為豐富了。 不知道你可有同感?

最後,附上幾篇Python 程序設計相關的文章作為延伸閱讀:

1,len(x) 擊敗x.len(),從內置函數看Python 的設計思想

2,編程語言之問:何時該借用,何時該創造?

3,Python 為什麼要保留顯式的self ?

4,Python 為什麼使用縮進來劃分代碼塊?