Categories
程式開發

2019年”大數據軟件“十大融資事件


導語:2015年和2016年,InfoQ都做過大數據領域的技術盤點,我們可以看到當時Hadoop和Spark正值盛年,且在不斷完善細節;流式處理逐漸成為趨勢。今年,我被一系列融資新聞所震驚,所以整理了十個融資事件,這些融資的特殊之處在於這些企業均是建立在大數據”軟件“之上。與其說15、16年是大數據發展之年,那麼19年則是大數據黃金收割之年。我們也能從這些融資事件裡看出Spark、Flink的強勁狀態,以及Hadoop的岌岌可危之態。如果你有更多想法,歡迎留言討論。

阿里 9000 萬歐元收購 Flink 母公司 Data Artisans

今年1月8日,阿里巴巴以 9000 萬歐元的價格接管了總部位於柏林的創業公司 Data Artisans。

Data Artisans 由開源流處理框架Apache Flink 的創建者Kostas Tzoumas 等於2014 年創建,使用它為企業部署大規模的數據處理解決方案,以便他們能夠即時響應數據,並做出更好,更快的業務決策。它的 dA 平台由 Apache Flink 和 dA 應用程序管理器組成,包括與容器編制、CI/CD、日誌、指標和狀態存儲的即時集成,並為公司提供所有流處理應用程序的單一視圖。包括 ING,Netflix 和 Uber 在內的全球公司使用 Data Artisans 的平台 Apache Flink 為大規模應用程序提供實時分析,機器學習,搜索和內容排名以及欺詐檢測。

Kafka背後公司獲1.25億融資,估值超25億美元

1 月 24 日,開源 Apache Kafka 項目背後的公司 Confluent 在官方博客宣布進行了 D 輪融資,價值約為 1.25 億美元,公司總估值高達 25 億美元。

Confluent 是最新的一家利用免費開源技術來提供服務、支持和管理工具並實現數千萬美元營收的開源獨角獸公司。 Confluent 是在 Kafka 項目的基礎上成立的,而 Kafka 是這家公司創始人在 2011 年擔任 LinkedIn 工程師期間與幾位同道一起研發的數據處理軟件。

與幫助工程師和應用程序查詢數據庫的系統不同,Kafka 將所有業務數據放在持續流動的事件流中。每次用戶登錄設備或按下按鈕,事件記錄就會在幾毫秒內流到相連的每個應用程序或數據庫。這意味著擁有大量數據的企業,或者由於競爭原因而需要近乎實時反應的企業,能夠通過 Kafka 大規模加快其應用程序的反應速度。

Spark 背後公司 Databricks 獲 2.5 億融資,估值 27.5 億美元

美國時間2 月5 日,由Apache Spark 創始成員成立的人工智能初創公司Databricks 宣布完成E 輪融資,本輪融資由美國私人風投公司Andreessen Horowitz 領投,微軟、NEA、Battery Ventures 等跟投,融資金額達到2.5 億美元。該公司目前估值已經超過 27.5 億美元!

Databricks 的知名早期項目 Apache Spark 起源於加州大學伯克利分校。雖然 Spark 仍然是 Databricks 的一個關鍵產品,但現在只是 Databricks 所做眾多事情中的一小部分。 Databricks 已將重點轉向機器學習,它的機器學習開源項目 MLFlow 的下載量已經超過 100,000 次。

Redis Labs 完成 6000 萬美元 E 輪融資,併計劃上市

2月20日,Redis Labs 宣布完成6000萬美元E輪融資,由私募股權公司美國弗朗西斯科夥伴公司(Francisco Partners)領投。

Redis Labs 是一家初創公司,圍繞 Redis 內存數據存儲提供商業服務(其中 Redis 創始人和首席開發人員 Salvatore Sanfilippo 是員工之一)。該公司宣布已經籌集了由私募股權公司 Francisco Partners 領投的 6000 萬美元 E 輪融資。

Apache Kylin背後的創業公司Kyligence 完成 2500 萬美元 C 輪融資

3 月 28 日,中國上海 Kyligence —— 由開源大數據 OLAP 項目 Apache Kylin 的核心團隊創建的大數據創業公司,宣布完成 2500 萬美元的C輪融資。本輪融資由著名科技對沖基金 Coatue Management 領投,原有股東紅點創投中國基金、順為資本和斯道資本等跟投。隨著這輪融資的完成,Coatue 合夥人 Daniel Senft 先生也正式加入 Kyligence 董事會。同時,美國最大理財軟件公司 Intuit 平台副總裁,前 eBay 平台副總裁 Debashis Saha 先生加入公司擔任董事會顧問。

C 輪的成功融資進一步支持了 Kyligence 在 AI 增強數據分析市場的創新。未來,公司將持續在核心技術及產品研發上進行投資,讓數據分析變得更簡單、快速和高效,實現與其他雲計算、大數據、商業智能供應商集成,為全球各地的客戶提供靈活性。

CockroachDB 母公司 Cockroach Labs 獲得了 5500 萬美元的 C 輪融資

8月7日,CockroachDB 母公司 Cockroach Labs 剛剛獲得了 5500 萬美元的C輪融資。此輪融資由高度計資本(Altimeter Capital)、老虎環球(Tiger Global) 和現有投資者GV 牽頭,參與方包括基準投資( Benchmark)、指數風險投資(Index Ventures)、紅點風險投資( Redpoint Ventures) 、FirstMark 資本和Work-Bench。

Cockroach Labs 聯合創始人兼首席執行官Spencer Kimball 表示:“為了與行業巨頭競爭,公司正在建立一個現代化的數據庫。CockroachDB 最初就被設計為是雲原生數據庫,從根本上說,這意味著它是分佈式的,不僅是跨單個數據中心的節點,而且可以跨數據中心。”

半年估值翻番達 62 億美元:大數據初創公司 Databricks 再獲 4 億融資

美國時間 10 月 22 日,由 Apache Spark 創始成員成立的大數據初創公司 Databricks 宣布完成 4 億美元F輪融資,本輪融資由美國私人風投公司 Andreessen Horowitz 領投,微軟、Alkeon Capital Management、BlackRock 等跟投。本輪融資後,Databricks 最新估值高達 62 億美元,與今年 2 月份完成 E 輪融資時的估值相比已經翻了不止一倍!除了大數據領域赫赫有名的開源項目 Spark,Databricks 在 2018 年 6 月、2019 年 4 月先後又開源了全流程機器學習平台 MLflow 和存儲層 Delta Lake,均在業內引起熱烈反響。在過去一年中,Databricks 的年度經常性收入(ARR)增長了2.5 倍以上,在本輪融資前,Databricks 剛剛宣布其2019 年第三季度營收達到2 億美元,而四年前他們幾乎還沒有任何收入。

基於Hadoop的大數據分析解決方案提供商Datameer融資4000萬美元

10月29日,Datameer是一家總部位於舊金山、擁有10年曆史的公司,它正在開發一個用於數據準備和分析生命週期管理的端到端平台,該公司今天宣布獲得了由ST Telemedia(STT)牽頭的4000萬美元融資

Datameer最初的解決方案是基於開源項目Hadoop的。 Datameer的聯合創始人包括Ajay Anand,曾是雅虎的雲計算和Hadoop的產品經理。另外一位創始人是 Stefan Groschupf ,原Lucene開源分佈式索引項目Katta的創始人。公司首席執行官Christian Rodatus表示,公司的最初使命是使Hadoop更易於為數據科學家、業務分析師等所使用。現在他們開始用雲原生產品DatameerX重建原始產品,新產品將基於Spark而不是Hadoop。 Datameer表示這項工作大約完成了三分之二。最新的這筆融資,會聘請更多的工程師推進新產品,也就是說這筆錢將用來擺脫他們的Hadoop根源。

另外國內同類型的星環科技在10月24日宣布獲得5億人民幣的D2輪融資

基於Apache Druid (incubating)的創業公司Imply融資3000萬美元

12月10日,實時分析公司Imply宣布再次獲得3000萬美元融資。加上原始股權融資,公司的總資金達到4530萬美元。融資將用於加速產品開發和公司的市場推廣。

Imply 成立於 2015 年,專注於大規模事件流(event stream)的高性能數據分析。 Imply 的共同創始人、CEO 楊仿今同時也是 Apache Druid 的核心開發者。 Druid 是一個開源數據存儲系統,旨在快速攝取大量的事件數據並提供低延遲查詢。此前,楊仿今曾任 Metamarkets(被 Snapchat 收購)和 Cisco 的工程主管,畢業於加拿大滑鐵盧大學計算機工程專業。

基於分佈式計算項目Ray的創業公司Anyscale融資2060萬美元

12月17日,由Ray團隊創建的Anyscale公司,在A輪融資中籌集了2060萬美元,由 NEA,Intel Capital,螞蟻金服等領投。

Anyscale具有一定的信譽度,因為它是由加利福尼亞大學伯克利分校計算機科學教授Ion Stoica和UC Berkeley教授Michael Jordan共同創立。 Stoica也是Databricks,Conviva的共同創始人,同時也是Apache Spark的最初開發者之一。 Anyscale基於一個名為Ray的開源框架,該框架也是在Stoica共同領導的實驗室中開發的。

Stoica在接受采訪時說,Ray的出現意義重大,因為它旨在解決行業中一個日益嚴重的問題。一方面,開發人員正在編寫越來越多的應用程序(例如AI和ML驅動的應用程序),這些應用程序對數據處理的需求越來越強烈。根據OpenAI的數據,自2012年以來,最大的人工智能應用程序的計算量每3到4個月就翻一番——這是一個驚人的指數速度。另一方面,處理這些數據所需的底層硬件的能力正在下降。因此,應用程序開發人員被迫在數千個CPU和GPU核心上“分發”他們的應用程序,以使硬件能夠滿足他們的需求,從而減少處理工作量。這個過程是複雜和勞動密集型的。公司不得不僱傭專門的工程師來構建這個架構,將AWS或Azure雲實例與Spark和Kubernetes等分發管理工具連接起來。