Categories
程式開發

放棄自研轉向PyTorch!估值二百多億的Chainer母公司倒戈


還有人在用Chainer嗎?可能很多開發者都沒有聽說過這個名字,但是提起同類型的TensorFlow、Keras、Caffe框架,大部分開發者應該就懂這個框架的作用了。出現至今,Chainer就被冠以“小眾”的稱號。如今,屬於Chainer的時代也要結束了,其母公司Preferred Networks(以下簡稱“PFN”)正式宣布轉向PyTorch,隨著最新升級版本v7的發布, Chainer將進入維護階段。 Preferred Networks將為Chainer用戶提供文檔和庫以便他們將項目遷移至PyTorch。

Chainer終是落下帷幕

12月5日,日本人工智能領域初創公司Preferred Networks總裁兼CEO Toru Nishikawa宣布,為加快深度學習技術的實施以及探索自身更具競爭優勢的新領域,公司計劃逐步將其深度學習框架(研究和開發的基礎技術)從Chainer遷移到PyTorch。

放棄自研轉向PyTorch!估值二百多億的Chainer母公司倒戈 1

同時,公司還將與Facebook和PyTorch社區的其他貢獻者合作,積極參與PyTorch的開發。隨著最新升級版本v7的發布, Chainer將進入維護階段。 Preferred Networks將為Chainer用戶提供文檔和庫以便他們將項目遷移至PyTorch。

Toru Nishikawa就這一商業決定做出瞭如下解釋:

“自開始使用深度學習框架以來,Chainer一直是我們能與豐田、發可那等生意夥伴展開合作的基礎技術支撐。正是因為Chainer,我們才能有機會與英偉達微軟等大型跨國公司合作。有了合作夥伴、社區和用戶的大力支持才有了現在的Chainer,Chainer對公司的重要性不言而喻。所以從Chainer遷移到PyTorch對公司來說是一個艱難的決定。但是,我們堅信,在參與開發PyTorch後,公司能夠進一步加快深度學習技術的實施,革新Chainer開發技術,同時尋找對公司來說具有競爭優勢的新領域。 ”

為什麼要遷移?

相比於TensorFlowKerasCaffe這些深度學習框架,Chainer在除日本之外的其他地區的存在感一直不是很高,儘管其GitHub代碼庫非常活躍,但卻並沒能引起業界應有的重視。

放棄自研轉向PyTorch!估值二百多億的Chainer母公司倒戈 2

自2015年6月開源以來,Chainer一直作為基礎技術支持PFN的研發,並為其業務增長做出了重大貢獻。它獨特的Define-by-Run方法受到了研究員和開發者社區的青睞。它可以讓用戶直觀、靈活地構建複雜的神經網絡,加快深度學習技術的進步,被當前主流深度學習框架視為標準方法廣泛使用。

近年來,深度學習框架逐步成熟,將深度學習框架本身當成競爭優勢的時代已經結束。 PFN認為,目前階段,與其做一些無關痛癢的改變從競爭者中脫穎而出,還不如大刀闊斧地革新技術,與像Facebook這樣的PyTorch社區貢獻者合作,確保PyTorch在健康的生態系統中保持可持續增長,從而進一步推動深度學習技術的發展。

據Toru Nishikawa稱,其實Chainer是PyTorch的靈感來源之一,PyTorch的autograd庫和nn.Module本身是基於Chainer的API設計的。雖然Chainer在操作上已經足夠簡單便捷,但是它覆蓋的使用者和應用範圍相比於PyTorch相去甚遠。 PyTorch 在學術界日益佔據主導地位,讓我們來看一下數據。下圖顯示了 PyTorch 論文和使用 TensorFlow 或 PyTorch 的論文之間的比率。 PyTorch今年在機器學習領域的表現幾乎碾壓其他學習框架,69%的CVPR論文、75%以上的NAACL和ACL論文、50%以上的ICLR和ICML論文都使用了該框架。

放棄自研轉向PyTorch!估值二百多億的Chainer母公司倒戈 3

目前,PyTorch已經成為增長最快的深度學習框架。僅在2019 年上半年,ArXiv 論文中 PyTorch 的引用量增長了 194%;PyTorch 平台的貢獻者數量比去年增長了 50% 以上,達到近 1200 人。

PyTorch為什麼深受研究人員喜愛?

簡單。它與 numpy 類似,非常 Python 化,並且可以很容易地與 Python 生態系統的其他部分集成。例如,你可以簡單地在 PyTorch 模型中的任何地方插入一個 pdb 斷點,這樣就可以起作用了。如果是 TensorFlow 的話,調試模型需要一個活動的會話,最終會使事情變得更加棘手。

卓越的 API。大多數研究人員更喜歡 PyTorch 的 API,而不是 TensorFlow 的 API。部分原因是PyTorch 的設計更好,還有部分原因是因為TensorFlow 需要通過多次切換API ,從而阻礙了自身的發展(如,“layers”→“slim”→“estimators”→“tf.keras”) 。

性能。儘管 PyTorch 的動態圖提供的優化機會嚴格來說很少,但還是有很多傳聞稱,PyTorch 的速度甚至比 TensorFlow 還要快。目前尚不清楚這些傳聞究竟是否真的,但至少,在這一領域中,TensorFlow 並沒有取得決定性的優勢。

遷移是眾望所歸

PFN將把它的深度學習研究平台遷移到PyTorch,從而使機器學習開發能夠實現靈活成型以及從研究到生產的平穩過渡。 PyTorch背後是包括Facebook在內的龐大的開發者陣容,還擁有著專注於研發的開發者社區,它也是學術論文中最常用的框架之一。遷移後,PFN能有效地將其最新研究成果整合到研發活動中,並能對現有的Chainer資產加以利用(前提是這些現有Chainer資產已經轉換成PyTorch資產)。 PFN將與Facebook和開源社區的PyTorch團隊合作共同促進PyTorch的開發,並在PFN開發的深度學習處理器MN-Core上支持PyTorch。

放棄自研轉向PyTorch!估值二百多億的Chainer母公司倒戈 4

PFN將與Facebook和開源社區的PyTorch團隊合作,為PyTorch的開發做出貢獻,並支持目前由PFN開發的深度學習處理器MN-Core上的PyTorch。

針對PFN此舉,Facebook公司和豐田研究院也發表了各自的看法:

Facebook人工智能基礎設施副總裁Bill Jia:

“作為PyTorch的主要貢獻者,我們很高興像PFN這樣的機器學習領域先行者能採用PyTorch作為未來開發框架,”Bill Jia說道。 “PyTorch對前沿技術研究的實現以及其分佈式訓練和推理能力,能讓PFN為客戶快速創建原型並將ML模型部署到生產環境中。”

同時,考慮到組織在ML工具方面的專業知識,整個PyTorch社區都將從PFN代碼貢獻中受益。 ”

豐田研究院CEO Gill Pratt:

“豐田研究院(Toyota Research Institute,簡稱TRI)和豐田高級開發研究所(Toyota Research Institute – Advanced Development,簡稱TRI-AD)很高興看到PFN做出這個決定,”Gill Pratt說道。 “PFN最初創建了Chainer並一直在進行積極維護,這為我們在自動駕駛領域的研發和高級開發做出了巨大貢獻。TRI和TRI-AD使用PyTorch也有一段時間了,他們認為採用PyTorch後,促進了我們對PFN深度學習的應用。”

最新版深度學習框架Chainer v7的主要特徵以及CuPy v7通用矩陣計算庫:

Chianer v7與基於C++的ChainerX之間相互操作更加流暢:
· Chainer v7包含分佈式深度學習工具包ChainerMN,大部分Chainer功能都支持ChainerX;
· 添加了TabularDataset類,以靈活地處理多列數據集
· 整合ONNX和Chainer,Chainer v7可以通過ONNX與不同推理引擎一起使用;

關於最新版Chainer的全部功能介紹,可以訪問這裡

結語

一直以來,Facebook PyTorch和谷歌TensorFlow的較量從未停止。此次,日本PFN公司轉戰PyTorch是二者持續競爭的最新進展。不難預測,PyTorch的熱度將持續走高,但現在推測它是否以及何時會形成壟斷趨勢還為時過早。

Preferred Networks背景介紹

據日經指數調查顯示,Preferred Networks以3515億日元(合32.4億美元)的企業估值位列181家日本初創企業之首。自2014年成立以來,日本汽車製造商豐田一直與Preferred Networks密切合作,並已向該公司的深度學習、機器人和自動駕駛研發投入逾110億日元(合1.01億美元)。