Categories
程式開發

估值62億美元,Databricks會成為企業AI平台的黑馬嗎?


作為Databricks的CEO,Ali Ghodsi的好日子來了。他剛剛完成一輪4億美元的融資,讓公司的估值達到了62億美元。這輪融資幾乎不費吹灰之力,他說“這是我經歷過的最容易的一次融資”。除了拿到融資,Ghodsi還透露了他的下一個終極目標:構建業內第一個企業AI平台。

估值62億美元,Databricks會成為企業AI平台的黑馬嗎? 1

Databricks CEO Ali Ghodsi

2013年,Databricks成立,有些人認為它跟當時不可一世的其他商業開源平台廠商沒有什麼兩樣。畢竟,Databricks的創始人們都曾經是Apache Spark背後的功臣,包括Matei Zaharia(在加州大學伯克利分校AMPLab學習時開發出了Spark),還有其他來自AMPLab或伯克利計算機學院的同僚們,如Ion Stoica、 Reynold Xin、Andy Konwinski和Arsalan Tavakoli-Shiraji。

如果說Spark是繼Hadoop之後的一個創舉——它確實是,並且會持續下去——那麼Databricks很可能會找到某種方式來讓Spark變現。 Databricks之於Spark,就像Cloudera之於Hadoop,或者MongoDB之於NoSQL數據庫。但事情不會就這麼簡單地發展下去,Databricks不會只騎著Spark這隻小馬走天涯,實際上,它已經另闢蹊徑,朝著另一個方向出發了。雖說Spark確實是Databricks公司規劃的一部分,但充其量也只是他們多元化SaaS產品的一個組成元素。

企業AI的出現

在一次採訪中,Ghodsi透露了這些產品將如何幫助他們實現公司的終極目標:構建世界上第一個企業AI平台。

“每個人都在想誰會成為第一家推出企業AI平台的上市公司?它又將如何幫助企業將AI集成到他們現有的軟件系統和解決方案中?每一個軟件系統——我是說所有現有的軟件系統——在未來十年都將變得更加智能。他們要么在軟件系統中加入AI能力,要么被市場淘汰,或者被其他擁有AI能力的公司打敗”。

“我們已經看到了Uber顛覆了出租車行業,Airbnb震動了旅館行業,亞馬遜把零售商店打得落花流水,這些事情都已經發生了。他們都使用了AI技術。那麼其他世界5000強公司呢?他們有自己的軟件系統,積累了幾十年的客戶,手裡掌握著巨大的數據集。他們可以利用這些數據為自己的軟件系統構建AI能力嗎?我想,他們當中有一部分會的,如果這樣做,他們就可以繼續生存下去,還有一部分不這麼做的將被具備AI能力的新公司取代。那麼,他們會使用怎樣的AI平台?在目前看來,這個問題還沒有答案……因此,我認為平台公司是時候亮相了,讓平台公司為這些軟件公司構建AI平台,幫助他們把AI能力集成到他們的解決方案中”。

在企業計算領域,行業可能會選出一兩個或者兩三個AI平台作為標杆,就像之前將關係型數據庫作為第一代企業軟件(ERP、CRM、金融軟件、HR軟件,等等)的支撐一樣。但目前還沒有出現標杆企業AI平台,儘管有一些玩家(AWS、微軟和Salesforce)已經躍躍欲試。在Ghodsi看來,Databricks手裡握著幾張王牌,即便它不一定會成為標杆。

“基於開源的創新是關鍵。我們有四個項目,除了大家熟知的Spark,迄今為止我們所做的最大的創新應該是Delta Lake,我們有超過80%的用戶在使用它。從價值方面來看,它是Databricks最有價值的項目,儘管它沒有Spark那麼有名”。

MLFlow是Databricks的另一張王牌。 Zaharia率先開發了這款軟件,它為數據科學家構建、測試和部署機器學習模型這個複雜的過程提供了標準化。 Ghodsi透露,MLFlow的下載量以每月80萬的速度增長,而且比Spark有更多的貢獻者。

Databricks的第四張王牌是Koalas,它將Pandas社區的數據科學創新帶給了Spark用戶。 Ghodsi說,Koalas可以讓數據科學家在筆記本電腦上使用Pandas編程,然後調用幾個API就可以將工作負載部署到大型的分佈式Spark集群上。

知識產權保護

除了軟件產品本身,Ghodsi認為Databricks的業務模式具備一個關鍵的優勢。 Ghodsi有意識地將Databricks的業務模式與典型的開源商業模式區分開來。在典型的開源商業模式下,軟件免費,廠商收取支持和服務費用。 Ghodsi把它叫作紅帽模式,這種模式在預置(on-prem)軟件世界里或許可行,但在新的雲計算世界可能找不到自己的位置。

Ghodsi說:“我們的業務模式跟其他的不一樣,我們是雲端託管的SaaS服務。在雲端託管開源項目並把它們租給用戶,這是一種更好的業務模式。這種模式的客戶流失率更低,客戶會更開心,利潤增長更快”。

SaaS租賃模式還為Databricks的資產(也就是知識產權)提供了保護。 Databricks的核心知識產權並不存在於它所贊助的軟件項目中,因為這些軟件項目是公開的。事實上,Databricks最有價值的知識產權存在於它用來監控和管理雲端軟件的工具和技術中,它們不會像經典的開源模式那麼容易被洩露。

Ghodsi說:“到了雲端,很多東西都會變得不一樣。在雲端,用戶租賃Databricks的服務,我們負責保證安全性、可靠性和可用性。我們負責監控這些東西,確保它們保持運行狀態。我們確保在有新版本出現時它們也能保持最新。我們負責所有的一切,而租用我們服務的公司可以高枕無憂”。

Databricks使用開源軟件(如Kubernetes)為各種數據工程、數據分析和機器學習負載提供伸縮能力,還開發了專有軟件來保證雲服務的可用性。

Ghodsi說:“保持服務運行是很困難的一件事情,而大規模運行則更難。我們每天需要在AWS上啟動一百萬個虛擬機,這件事本身就很難,而確保它們正常運行、監控它們、保證它們的安全性和可靠性,也很難。這也就是為什麼用戶需要付錢給我們”。

Uber、Airbnb和亞馬遜已經投入數億美元用於構建自己的數據工程和AI系統,這讓它們在各自的市場中佔有一席之地。現在,Ghodsi想要幫助其他企業構建自己的AI能力,或者至少是嘗試一下。

他說:“關鍵在於我們不希望用戶操心太多東西,我們會為他們操辦一切,包括安裝、管理和升級軟件系統。我們希望用戶可以把精力放在解決AI問題和業務問題上……我不明白為什麼一家想研發慢性肝病藥物的公司要去關心Kubernetes以及如何管理和配置Kubernetes集群。這些事情應該在幕後進行,而這些也就是我們要做的”。

從業務模式來看,Databricks有可能會是贏家。

原文鏈接:

https://www.datanami.com/2019/12/02/will-databricks-build-the-first-enterprise-ai-platform/