Categories
程式開發

Zilliz创始人星爵:国产开源需要更多利他主义


在技术以及市场均有局部领先优势凸显的情况下,国内基础软件+开源领域真正出现一家具有全球影响力的创新企业的概率极大。

迈入 2020 年,迫于外部环境的变化与调整,一些此前不被看好的开源以及数字化基础设施层项目,也开始迎来了资本市场的重视。

以一级市场上真实的投资案例为例,国内物联网大数据平台涛思数据与云管理软件及服务提供商骞云科技两家企业,均分别在今年各自获得两轮融资。而在国外,开源数据库 CockroachDB、云存储技术服务商 Snowflake 等企业也均有新进融资。

可以说,在全球经济增速下行,科技产业竞争格局日趋加剧的大背景之下,大国之间科技自主可控的需求进一步凸显,而夯实底层技术与产品能力,以开源创新释放新的增长动能,也因此变得极为重要。

近日,InfoQ 特别面向广大新一代信息技术领域的技术中坚群体,正式推出「中国技术力量」之「中国开源创新 30 人」栏目,特别针对国内活跃的开发者社区和企业开源组织生态,重点约访国内主流的开源理念倡导者、企业型开源业务领导者,输出他们对于开源创新、技术前瞻,以及未来企业发展的思考精华。

「中国开源创新 30 人」第 1 期,我们邀请到 Zilliz 创始人星爵以及公司合伙人顾钧接受了我们的采访。2020 年星爵成功当选 Linux 基金会人工智能子基金会董事会主席,这也是中国代表首次担任国际顶级开源 AI 社区的最高职务。
Zilliz创始人星爵:国产开源需要更多利他主义 1

在 Linux 基金会职务之外,星爵于 2017 年创立的 Zilliz 也已先后两次获得资本助力,公司在 2019 年 10 月 15 日正式开源的第一款产品——向量搜索引擎Milvus,在7个月内积累了300多家企业级用户。

或许,通过对 Zilliz 以及公司创始人队伍的了解,我们能对国内“基础软件+开源”产业的发展现状有更清楚的认识。

做 AI 时代的 ElasticSearch

在整个 IT 领域,以文本、图像、音频、视频等为代表的非结构化数据,已经牢牢占据了整体数据量超过 80%的比例。而随着 5G、AI、云计算等技术的普及发展,海量数据的爆发已成为必然到来的事实,而非结构化数据所占据的比重与分量,也将越来越重。

可以说,面对海量的互联网数据,如何将越来越重要也越来越基础的非结构化数据进行存储、查询、分析、挖掘和利用,已经成为了 AI 时代极其迫切而又意义重大的事情。

成立于 2017 年的 Zilliz,正是这样一家致力于让机器更快读懂非结构化数据,进而加速产业数智化转型升级的初创型企业。

“在 AI 大数据时代,非结构化的数据必然需要有一些专门的数据处理类企业来做,这就意味着将会有企业发展崛起的机会出现。”这是星爵开始创业的理由。

“我们要做 AI 时代的 ElasticSearch。”提及公司未来发展可能参考的对象,星爵的回答目标性极强。毕竟在美国,ElasticSearch 这家开源从事数据实时搜索与分析的竞对企业,如今已登陆纳斯达克,市值高达 80 亿美元。

在朝着“成为 AI 时代的 ElasticSearch”进发的过程中,Zilliz 所采用的是一种与大多数初创技术型企业都不同的方式——将公司辛苦研发了两年的非结构化向量数据搜索引擎Milvus完全开源了。

对于一家初创技术型企业而言,在创业初期就将公司最核心的代码开放出去,无疑是一个非常冒险的决定,毕竟公司技术骨干辛苦研发的代码一下子就这么免费了。要知道,Milvus 研发了 300 多天,在完成 3600 多个 commit、5 次版本迭代和 7 万多行源代码后,才有了 Milvus 的第一个开源版本 Milvus 0.5.1。

除了精力和时间,这一做法在可见范围内的商业回报自然也将大打折扣,看似得不偿失。不过在星爵看来,决定把代码开源,其实是深思熟虑之后的大胆尝试。

一方面,作为被定义为基础软件的产品,一个衡量硬指标就是使用规模。一个基础软件产品或者服务要想覆盖全球数千万家用户,在产品的市场化过程中最重要的方式便是通过开源与用户建立联系与信任,降低营销和获客成本。待用户形成消费习惯再去做服务,这个时候对于新产品的推广会变得更加容易。

另一方面,越是基础层产品,要满足人们普适的需求,长期来看,其成本必须要无限降低并接近于零。当一件产品的成本太高,那么能够使用它的人也势必会减少。

“如果你做一款基础软件,同时还不选择开源,那么你已经输在起跑线上了。”星爵表示。软件正在吞噬世界,而开源则正在吞噬软件。

所幸,由于相比 Facebook 开源的 Faiss 向量搜索库和微软开源的 SPTAG 库,Milvus 能够提供更加完整的向量数据更新、索引与查询框架。开源半年之后,Milvus 已经成功为 Zilliz 带来了 300 多家企业级用户。而一直积极参与 Linux 开源基金会建设的星爵,也于今年 4 月 22 日当选 Linux AI 基金会的新一届董事会主席。

AI 下半场大有可为

在 IT 技术领域,我国在越早期、越基础的层面,往往落后越发明显。反而是在移动互联网、O2O、AI 等新近出现的技术领域,我们已经在一定程度上达到了追赶甚至于齐平国外发达地区的水平。

这一点,市场的反映更为直观。在 PC 时代,我国在操作系统技术层面严重落后,致使国内 IT 产业“少魂”。而到了 4G 时代,“抖音们”已经走出国门,通过技术创新实现了全球市场领先。

在新一轮的智能化产业变革浪潮中,国内市场与海外发达市场站到同一起跑线上竞争,弯道超车的可能性出现,这成为了促使 Zilliz 以更加积极的态度布局 AI 时代非结构化数据的关键。

而在另一方面,在弯道超车的同时,市场领先机会的出现同样坚定了 Zilliz 对于 AI 赛道的押注。

从宏观的经济与科技产业发展哲学角度来看,一个国家和地区经济发展导致的市场需求领先,最后往往能够倒逼技术和产品的领先。“上一轮信息产业发展热潮中,苹果、英特尔等技术公司主要出现在美国,这是有原因的,因为当时的文化、信息技术都是美国领先,市场和需求领先之后倒逼出的产品和技术也是领先的。”

在星爵看来,国内企业的AI 下半场大有可为。

事实上,在 2019 年计算机领域知名的 CVPR 大会上,来自中国的学者发表的论文数量占总论文数的比例高达 40%,而且最佳论文奖等大奖项几乎全都被华人包揽,这直接证明了我国在 AI 研发以及运用领域的后发优势明显。

受制于教育背景以及环境熟悉等方面的条件限制,人在解决特定问题时,其实并不能够达到 100%精确的程度,大多数在 80%~90%左右。而在这样的辨识度下,目前限定场景下的计算机视觉技术已经能够很好地满足业务处理精度需求,AI 已经局部具备走入真实生活场景并解决问题的能力。

在上一轮以算法和模型为主的产业发展浪潮当中,商汤、旷视等企业取得了先发优势,但随着算法的进步逐渐成为瓶颈,上半场的商业机会和市场红利开始接近尾声;进入下半场,结合具体场景的需求做运用以及进行创新的机会才刚刚浮现,并且势头正旺。

据星爵介绍,目前 Zilliz 有 50 多名员工,其中有 40 多名是工程师,公司正在强化人才以及技术的储备,希望在今年内实现团队人数从 50 多人到 100 人的扩充。然后在 2021 年底突破 1000+用户,达到开源项目的规模效益临界点,并进行商业化探索尝试。

**通过开源的方式,Zilliz 正在构建专属于 AI 时代的新型基础设施。
**

开源需要更多利他主义

对于加在身上的一些职位殊荣,星爵看得很淡。“我更多将它看做是一个责任,期待能够更多的服务于社区,让更多人参与进来,一起创造价值。”在采访过程中,星爵多次提及利他主义这个词。

“在利他主义的驱使之下,前辈们先后开源了 Java、Hadoop、Spark 等一系列项目,让国内企业从中受益。在这种开源利他主义的趋势之下,如果有一天你有机会真正参与到开源项目当中,也把自己的产品开源出去帮助到别人,那会是一件非常有意义的事,同时也是对于前辈利他主义的一个回应。”在星爵看来,积极参与开源,已经上升成为了公司发展的使命。

“开源其实是减少重复造轮子的重要手段,对于一些比较基础的底层技术,如果各家企业都各自闭门研发,必然造成重复投入以及后续市场的恶性竞争。”在 Zilliz 合伙人顾钧看来,通过开源共建的方式促进国内信息技术的创新发展,是产业发展的一剂良方。

但是就目前的情况来看,国内想要真正催生出具有全球性影响力的开源产品,还面临着诸如开源项目商业化模式不清晰,知识产权保护亟需提升,以及市场包容性不强等方面的难题。

长久以来,开源在国内往往被看做是与免费等同的概念,用户对于开源产品的接受度和付费意愿较弱。一旦开源项目得不到市场的认可并形成恶性的商业形态,项目的可持续性就会被打上问号,选择用这一产品的人也就越来越少,于是开源生态想要发展就会变得更难。

“将开源等同于免费本质就是一种开源市场上利他精神缺失的体现,如果你用一家公司的产品,却一直去薅这家公司的羊毛,最后这家公司没能经营下去倒闭了,那其实这对你多少也会带来一些影响。”在星爵看来,开源创新的实现,首先需要建立在一个良性且可持续发展的环境基础上。

结语:国产开源的潜行

目前,国内开源领域的参与者主要可以分为三类:首先是以阿里、百度等大型企业为代表的大型企业开源生态;其次是以鹏城实验室等为代表的,具有一定政府以及产业背景的第三方组织机构;此外才是 Zilliz 这一类由初创型企业组成的开源力量群体。

三类群体中,大企业是开源力量的主力,但他们参与开源的目的更多的在于通过技术能力的外放,提升自身的美誉度,进而达到一定的人才吸引以及企业生态组织的目的。以行业协会或者第三方机构组成的开源群体往往具有一定的行业引导以及治理倾向。而以 Zilliz 这一类初创企业为代表的企业,他们在参与开源的时候往往也伴随着一些获客或者商业化的目的。

在拥有全球最大的用户市场的同时,国内科技产业在新一代的 AI、云计算等智能化技术的发展历程中都具备了充分的技术储备以及先发优势。长远来看,在技术以及市场均有局部领先优势凸显的情况之下,国内基础软件+开源领域真正出现一家具有全球影响力的创新企业的概率极大。

但是我们仍然需要看到的是,在看似一切皆有可能的背后,国产开源开放度与活跃度不高,社区治理以及开发者贡献方面仍然有许多有待于提升的地方。

在国外已经出现了包括 Apache、Linux 开源基金会,以及 GitHub、MongoDB 等不同形态的开源生态参与者时,国内开源生态的形成仍然处于早期发展阶段,后续仍然需要持续耕耘付出,在不断摸索之中潜行。

嘉宾介绍

Zilliz创始人星爵:国产开源需要更多利他主义 2
星爵:Zilliz 创始人兼首席执行官,是一位拥有超过 18 年经验的数据库和 AI 专家,目前还担任 LF AI 基金会的董事会主席。LF AI 是 Linux 基金会旗下的子基金会,支持人工智能、机器学习和深度学习领域的开源创新。 在 Zilliz 之前,星爵在 Oracle 美国总部工作了多年,负责 Oracle 关系型数据库系统研发。他是 Oracle 12c 云数据库项目的创始成员和主要贡献者。,目前Oracle 12c 已累计实现了超过百亿美元的收入。星爵拥有威斯康星大学麦迪逊分校的计算机科学硕士学位和华中科技大学的学士学位。
Zilliz创始人星爵:国产开源需要更多利他主义 3
顾钧:Zilliz 的合伙人、首席布道师,拥有超过 16 年数据库产品经验,他目前还担任 LF AI 基金会的技术咨询委员会投票成员。在 Zilliz 之前,顾钧先后服务过工商银行(数据库工程师), IBM (信息管理产品售前技术专家), Morgan Stanley (副总裁,数据库专家),华为(数据库产品战略规划专家)。顾钧拥有北京大学的计算机科学学士学位。