Categories
程式開發

菜鳥網絡的AI進化方向:不追求“通用”的融合,重心是AIoT


隨著智能的概念愈加深入人心,智慧交通也正逐漸走進大家的視線。就AI技術而言,物流是一種很好的應用場景,但是由於“近地端”的原因,智能物流、智慧交通等AI技術的落地應用,並沒有想像中那麼簡單。

為了解工業界在智慧物流交通體系的最新嘗試和進展,以及菜鳥網絡在技術演進過程中所收穫的各種經驗,InfoQ 記者在 AICon 全球人工智能與機器學習大會 北京 2019 現場採訪了阿里巴巴菜鳥網絡人工智能部資深算法專家胡浩源老師,以下是採訪的具體內容。

菜鳥網絡的AI進化方向:不追求“通用”的融合,重心是AIoT 1

InfoQ:胡老師您好,很高興能夠採訪您。首先能否請您為我們總體介紹一下,菜鳥網絡在引入AI概念之後,經歷了哪幾個階段的技術架構演變、以及在每個階段您和您的團隊所做的重點工作是什麼?

胡浩源:菜鳥是這樣的,第一個階段我們叫做數字化階段,因為數據是一切之本,如果數據本身沒有積累到一定程度,就沒有完成自動化決策這個階段,也是沒有辦法直接跳到智能化決策這個階段的。第二個階段我們叫單點優化階段,在這個階段,我們尋找了一些相對還比較明確的記錄單點,它相對的業務嫁接比較清晰,我們會開發對應的算法對其進行優化解決。第三個我們叫協同優化或者全局優化階段,這個階段它就需要一個體系化的打法了,我們有一個包裹引擎,它承載了整個菜鳥數據建設的體系,該體系涵蓋了與CPU、GPU分佈式的一個交互、一些特定求解器的近似算法、一些通用求解器的分佈式擴展以及和深度學習的結合,在最上層,則是供業務算法同學快速調用開發的Framework。

InfoQ:在菜鳥網絡 AI 技術架構演進過程中,您和您的團隊所遇到的最大挑戰是什麼?最後又是怎樣克服這些困難的呢?

胡浩源:對於菜鳥而言,因為菜鳥網絡隸屬於運籌優化的技術線,它需要求解很多問題,這與以前機器學習所面臨的大數據問題不同,它是在“NP難”情況下離散優化的問題,所以它有一個天然不容易調和的矛盾,就是“線上業務的及時性”與“求解計算複雜度所帶來耗時”的衝突。簡單來講,就是我們要去決定一個切箱,或者一個路徑的規劃,調用求解器需要24個小時,但實際上,我們正​​式要投入生產實驗組則可能是在幾百毫秒內必須求解出來。

在這個過程中,一方面是我們整個團隊的配置比較靈活多樣,除了運籌優化的同學,我們還有機器學習、CS和ACM相關的一些同學;另一方面我們主要是基於啟發式的算法,對算法進行改良,以及在實現上用並行相關、更高效的一些算法,去提升算法求解的速度;再一方面就是像剛才我在演講的時候說的,在數據驅動場景下,機器學習、深度強化學習和運籌優化的結合,使得結果不再是被求解出來,而是被機器學習直接學出來,進而去協調解決及時性與求解耗時的矛盾。

InfoQ:菜鳥網絡的AI能力主要表現在哪些方面?在這些方面都是如何使用AI技術的?

胡浩源: 菜鳥網絡的AI能力分為這麼幾個方面:第一是大家所熟知的AI能力,就像圖像、語音等,我們會有一些攝像頭,做基於圖像的一些信息感知;有像智能客服、語音這一類的通用AI;也有針對菜鳥特有的一些specific AI,就像我們剛才說的,關於路徑規劃問題的求解,目前我們破世界記錄數是全世界第二。然後除了啟發式特定,也就是叫specific 的求解開發之外,我們還投入了一部分同學去做混合整數規劃和機器學習結合,以及真的去做一些硬核的VRP Solver的開發,這一塊是我們構建物流也好、做產業互聯網也好,或者生產製造業運籌優化這個領域中像基石一般的存在,就相當於機器學習底層框架一樣。

InfoQ:據我們了解,想要實現智能物流“融合”的概念特別重要,想要請教一下胡老師,菜鳥網絡在將機器學習、分佈式並行計算、運籌優化算法等技術融合的過程中,菜鳥網絡都踩過哪些“大坑”?對於後來者來說,您覺得最需要注意的幾點是什麼?

胡浩源:一方面,融合是這幾年學術界和工業界風口浪尖非常火的一件事,另一方面,融合也是大家確確實實能夠看到的一個比較Promising的Direction,它是面向未來的一個方向,但是融合也並不是想像中的用一些比較簡單的方式去融合。

關於融合,有一種最簡單的方式就是先做預測,再根據預測結果,調運籌優化的相關算法去求解;但這種融合方式的效果是很有限的,因為預測本來就帶有偏差,再根據其預測結果求解就是在把這個偏差放大。還有一種融合方法是去加速運籌優化的求解,這就相當於機器學習在裡面調一些運籌優化相關的參數,讓它變的更快、更好。還有就是像我們現在正在探索的,看能不能直接預測出一個結果來。

關於踩過的坑或者心得體會經驗,我覺得是這樣的,機器學習並不通用,而是因為在豐富的歷史數據前提下,我們把這個求解過程,調得適配於歷史數據,以及適配於將來可能會遇到的數據;機器學習和運籌優化的融合應該是基於這個原則進行,而不是去追求一個通用的機器學習和運籌優化的融合。

InfoQ:目前您和您的團隊正在做的關於機器學習和運籌優化領域相結合的算法主要是具有哪些特點?能否為我們舉一個典型的算法實例大致說明一下?

胡浩源:我們現在正在做的融合,並不是去碰那些通用的機器學習和運籌優化的融合,而是站在產業界的應用上去做。

舉一個最簡單的切箱例子,你很少會見到一個包裹裡面有一千個,甚至一萬個商品的情況,特定場景下的數據,基本上不會發生很大的改變,就比如大部分的包裹數不會超過十個,那麼我們就可以通過歷史數據,利用深度強化學習不停的去調,調出一個適用於某個場景的結果;但我並不承諾說,這個場景的結果立刻放到另外一家公司的切箱上就能夠有用,就切箱來說,它可能一個包裹只有一兩個商品,或者說它是切集裝箱,一個集裝箱有一萬甚至兩萬的商品,具體情況要具體分析;所以,總而言之,我們探索的是一種可以復用的方法論,而不是到哪裡都可以使用的模型。

InfoQ:當前,智慧交通物流的發展現狀是什麼?如果想要再進一步,會面臨哪些困難和挑戰?

胡浩源:現在智慧交通物流發展現狀就是局部可能已經有人工智能的相關力量介入了,也產生了一些效果,但是它是一個集成工程,如果你不能在全鏈路上的每一環都做好數字化和智能化的話,它發揮的價值比較有限。

在未來一段時間內,人工智能和IoT的整合是非常重要的一件事情,就像我剛才表達的,你首先得有數據,有了數據去做自動決策,有了自動決策才能再去做智能決策,我覺得在未來一段時間內,IoT 和人工智能結合的 AIoT會是一個比較大的方向。

InfoQ:那麼隨著5G時代、AIoT時代的到來,菜鳥網絡在這個大前提下會進行哪些轉變,換句話說,菜鳥網絡未來的進化方向是什麼?

胡浩源:我們現在已經有一些AIoT 相關的工作在嘗試,就比如今年4月份我們在物流峰會上發布的APP箱,這是雲邊端概念的一個比較好的展現,它把以前在端上非常複雜繁瑣APP設備,極簡化成了一個很小的指令箱,它只做下髮指令等一些簡單的事情,把很多複雜的決策交給中央大腦,讓人工智能去決策。

而隨著5G的到來,會使很多端上的設備煥發出更好的生命力,就比如說艙內的級別也好、艙內的APP箱也好,這些在應用時都會面臨同一個問題,如果用WiFi之類的AP它會頻繁的掉線,如果用4G會面臨成本的問題,但是5G與端側設備的適配程度是比較高的,這對我們全面推進數字化轉型具有比較大的作用。

InfoQ:在您看來,未來的智慧交通物流將會是怎樣的一個發展趨勢?

胡浩源: 我覺得未來的交通物流智能化一定會走向一個端上逐漸決策弱化,基本在中央大腦堆積決策的階段。

現在很多的事情就是,一方麵線上化決策,一方面依賴於分佈各處的節點。而未來肯定會是,節點的工作變成一個執行指令的過程,不需要有太多的思考,所有的決策下發都會交給中央大腦去執行,因為理論上來講,中央大腦能看到所有的數據,它可以比任何的局部做出更優的決策。

關於端側的人工智能,則會以感知為主,不再涉及決策;端側的人工智能可能會去進一步發展感知信息的能力,包括圖像相關的一些事情,但是它不再需要在端上做決策,比如說某個功能怎麼實現、兩側怎麼走、去接什麼單等。而就端側的一些AI芯片來講,大部分我們稱作是圖像AI芯片,由於圖像傳輸成本較高,如果可以在端側就能把圖像要表達的信息推理出來,能夠大幅度降低成本,所以本質上來說還是一個成本上的考慮。

嘉賓介紹:

胡浩源,菜鳥網絡資深算法專家,目前主要從事機器學習和運籌優化領域相結合的算法研究和架構體系設計。在阿里巴巴歷經阿里雲、天貓推薦、搜索、菜鳥網絡,2015年團隊獲得CEO特別貢獻獎。所領導的團隊構建結合精確求解、啟發式求解、深度強化學習求解的Greed Solver中的VRP Solver,突破了幾十個世界範圍內的best known solution。