Categories
程式開發

在这里,腾讯向世界展示了优图实验室的8年史诗


2020 年 7 月 10 日,WAIC2020 世界人工智能大会腾讯论坛正式拉开帷幕,来自国内外学界、业界数十位重量级嘉宾纷纷亮相此次腾讯论坛。腾讯优图作为此次论坛的主办方以及腾讯 AI 能力的尖端体现,此次大会也是腾讯向世界展示优图实验室成绩的最好机会。

在开场致辞中,上海市人民政府副秘书长陈鸣波提出“ToC 的起来了,ToB 的却还在睡觉”,为本次腾讯论坛的主旨点名了方向。这也预示着,在全面拥向产业互联网的今天,用 AI 能力加速产业唤醒正显得尤为重要。

正如腾讯高级执行副总裁、云与智慧产业事业群总裁汤道生所认为的一样,人工智能是新基建理念的核心技术之一,也是产业互联网的“中央处理器”。

在这里,腾讯向世界展示了优图实验室的8年史诗 1

腾讯高级执行副总裁、云与智慧产业事业群总裁汤道生

汤道生认为,在当下 AI 对于企业而言将产生三项新的附加价值:

  • AI 将优化生产和服务流程,提升人均产值,优化企业成本结构,挖掘产业新价值;
  • AI 使让机器拥有了视觉和听觉,推动了产业新动能,将催生新的产业模式诞生;
  • AI 与 5G、云、物联网、区块链等技术的深度融合,联同打造业务传输存储的新模式,形成完整的产业驱动链。

2018 年以来,马化腾在多个场合发表过关于产业互联网的演讲。当移动互联网红利消失殆尽的观点渐趋主流时,马化腾指出:资本对于互联网产业的追逐是有周期性的,产业互联网的春天才刚开始。中国的创新红利还在,而且潜力巨大。

而人工智能在这样的大背景下,也在向产业发生着演变。

人工智能正向着泛在智能阶段演进

在会上,腾讯公司副总裁、腾讯研究院院长司晓在演讲中指出:“未来,智能技术会是一个渗入到生活、无所不在的状态,可以说它很重要,因为万物都会依赖于它;也可以说它不起眼,因为智能技术化为无形,融于万物其中,而腾讯正在向着这样的目标努力。”

在这里,腾讯向世界展示了优图实验室的8年史诗 2

泛在智能全景图 制图:腾讯研究院

“泛在智能”,是此次白皮书中腾讯对人工智能当前及未来一段时间发展状态的描述。用更通俗的话来说,即人工智能技术将广泛渗入新型基础设施建设,且获得越来越多元的应用场景和更大规模的受众。

在“泛在智能”的背后,是人工智能正在走进产业供需融合的新发展期。为此,白皮书还对 AI 基础技术的发展进程及趋势,疫情背景下 AI 的落地应用,AI 催生创新经济的表现以及相应制度保障进行了专门的分析。

而在腾讯向着泛在智能阶段大踏步迈进的背后,则是一家以计算机视觉为主要攻坚方向的科技实验室不断做出的努力。

2012 年,起步

一场由图片二次压缩技术所开启的人工智能

2008 年,黄飞跃从清华大学博士毕业后本想从事在攻读博士过程中所研究的人体动作识别课题相近的工作,但在当时,相关的人工智能领域还处于瓶颈期,该领域并不吃香。在 2011 年,已经加入到当时腾讯研究院的黄飞跃发现腾讯公司内部的众多业务中,大量的图片存储与传输体量提升了公司内部的研发成本。同时他也注意到图片压缩技术的发展,因此将图片二次压缩定位当时的重点研究方向。

无论是在腾讯还是阿里,作为一个体量如此巨大的世界级互联网公司,旗下各条业务线非常复杂,且技术部门众多,技术部门的发展在很大程度上依赖于业务部门的需求。黄飞跃团队此时并没有直接对接的业务线,恰好这个问题是公司内普遍存在的问题,解决了它,无疑就是为这个团队打开了声量。
因此黄飞跃带领着不到十人的团队开始对”图片二次压缩技术“展开了研究,随着研究的深入和技术的不断成熟,黄飞跃开始在公司内部向各条业务线”推销“这个能力。最终凭借着能够将图片压缩 20%-30% 的强大实力,有效降低了因为大存储、高带宽所带来的成本压力,为公司节省巨额资金及存储空间。

而团队也借此机会更名为“优图”,这也是优图的第一场成名战。

2014-2017,出街

趣味的人脸融合算法,为腾讯消费互联网做技术支撑

一场”武媚娘“和一场”军装“,更是让优图实验室受到腾讯集团的瞩目。

2012 年下半年,优图实验室将研究重心转移到人脸检测识别方向,开始进行计算机识别领域技术的研发和储备。此时正逢腾讯的组织架构调整,原本隶属于当时腾讯研究院的优图并到了腾讯社交网络事业群旗下。
此时的 QQ 生态如日中天,QQ 空间业务更是成为腾讯公司业务旗下最大的图片聚集地,这就为优图实验室的能力输出至 C 端泛娱乐领域提供了绝佳的输出空间。

2013 上半年,优图开始将人脸检测技术输出至 QQ 空间,2014 年,QQ 空间“面孔墙”全量上线,作为业界最早在大规模社交网络平台中人脸识别技术的应用,优图团队又一次证明了自己的能力,而此时黄飞跃所带领的优图团队规模只有 20 人不到。

前几年,朋友圈中的换脸 H5 曾一度非常流行,武媚娘装束、军装照的都是出自天天 P 图的手笔,但是在这背后,提供给天天 P 图机器视觉能力的也是优图实验室。

这部分业务被优图实验室归为泛娱乐领域,这种能力在实现起来尤为困难。因为存在着不同场景、视觉干扰、服装、光线阴影、用户姿势等等能够对影响最终结果进行干扰的重要因素。优图实验室结合新的融合算法基于深层对抗网络,通过解耦学习的策略,对不同的光线、脸型、姿态的特征进行建模。这才有了一夜爆红的武媚娘妆容一夜炮红以及通过“人脸融合”能力实现的《这是我的军装照》这款现象级 H5。

这是优图的第二场成名战。

微众银行开启优图的行业应用赋能之路

2014 年上半年开始,黄飞跃带领优图团队开始探寻大量人脸识别应用场景,和腾讯征信负责人挖掘人脸识别的一个创新应用,即通过自拍照和身份证照片比对,来确认是否为用户本人(人脸核身),这一能力在后来的互联网金融领域得到了验证。

2014 年微众银行需要做人脸远程开户,由于微众银行是互联网银行,不存在线下营业网点,因此线上开户过程中的人脸核身能力就显得尤为重要。现在,微众银行已经是优图实验室的重要合作伙伴。前段时间微众银行、腾讯云云安全天御和腾讯优图依托实践经验,打造了基于人脸识别的 KYC(Know Your Customer) 服务,又称为以人脸识别为核心的金融级多因子身份验证服务,其中的多因子包含身份证 OCR 及验证,银行卡 OCR 及三或四要素验证,无疑进一步增强了线上身份验证的真实性。

这一战,微众银行的成功实践让优图实验室认识到,原来自己的很多技术已经十分成熟且具备对外输出的能力。

在成功打出微众银行这个线上人脸核身案例后,优图实验室将技术逐渐开放给腾讯内部更多的业务,并在 QQ、QQ 空间、QQ 音乐、财付通、天天 P 图等明星产品中成功落地,也与滴滴、联通等标杆企业达成合作。
优图实验室 ToB 路,开了个好头。

2018 年,优图思维模式转变的关键阶段

在黄飞跃看来,优图实验室能够顺利从一个单纯提供 AI 能力的实验室到成功转型为一家能够赋能行业的科研机构,最关键的是思维模式的转变:从怎样把技术做好到思考如何将技术转化为具体业务价值,从专注技术到深入行业中把技术价值最大化。

2018 年,腾讯正式宣布向产业互联网进军,随着公司级整体业务方向的转变,优图实验室也在思考自己未来的发展方向。

当年 9 月 30 日,腾讯宣布组织架构调整,当时隶属于 SNG 的优图实验室调整归属于 CSIG 云与智慧产业事业群,优图实验室开始和云与智慧产业形成更密切的联动配合。

通过腾讯云、微信等输出视觉 AI 能力。在金融、零售、政务、社区、物流、文旅等领域开始逐渐丰富其解决方案。

为产业互联网赋能

在过去的几年中,我们一直都在坚持基础研究和产业落地两条腿同时走路,这是优图实验室一贯遵循的做事方式。– 黄飞跃

在 7 月 10 日第三届 WAIC 世界人工智能大会上,上海市人民政府副秘书长陈鸣波将计算机视觉技术称作为人工智能的眼睛,由此可见计算机视觉拥有着更为广阔的落地场景。

说起来简单,但是做起来却并非易事。C 端和 B 端完全是两个需求不同的群体,也完全是两种不同的思维模式,对于产品的打磨、精细化程度、对于效率的提升等方面的要求更是不可同日而语。黄飞跃认为,C 端和 B 端的差别主要在定制化层面。C 端定制化需求低,主要解决的是用户的通用需求;而 B 端则会有很多定制化需求,需要面向不同用户提供不同的服务。

孔子云:学而不思则罔。而腾讯优图实验室的这次,堪称国内科技实验室由学术向产业”转型“的典型案例。

在为 ToB 用户提供服务的过程中,黄飞跃也对优图实验室的快速转型做了思考,他认为关键在于优图实验室做到了以下三点:

  • 首先,提升技术业务价值的关键在于用户体验,优图实验室借由腾讯面向产业互联网的优势能力,积累了很多用户的洞察,将 C 端能力与经验输出给 B 端的合作伙伴,让企业能够更好的触达用户,这也就决定了优图所有研发的技术都是有用户基础的;
  • 其次,将业务落地的过程中看做是技术不断优化迭代的过程,这样做的好处是一方面技术实现的效果越来越好,应用场景也越来越多,最后形成技术与业务落地之间的良性闭环;
  • 最后,将团队研发的方向聚焦起来,而并非一昧的放大思维。在当前技术积累做透后再适当进行领域扩展,确保对外输出的技术在当时世界上是最好的,并在之后能够通过不断优化以达到持续精进。

现在,社会正在将优图的理想一步步变为现实

优图团队的基因就是探索有价值的业务点,寻找技术能够在业务中的的价值并放大到极致。

一场疫情并没有拖慢优图实验室向产业赋能的进程。在 WAIC 世界人工智能大会腾讯论坛之上,腾讯优图实验室总经理吴运声认为,只有践行开放协同才能最大化释放 AI 产业价值,尤其在产业互联网时代,技术的进步需要更多的开放协同。

因此腾讯优图实验室在大会现场,重磅发布了 AI 泛娱乐平台,广电传媒 AI 中台、内容审核平台以及工业 AI 平台这四大平台。

在这里,腾讯向世界展示了优图实验室的8年史诗 3

  • AI 泛娱乐平台,通过将包括美颜美妆、人像分割、人脸融合、变形之类的能力聚焦在一起形成泛娱乐工具箱,帮助产品及开发人员能够快速调用相关的泛娱乐能力;
  • 广电传媒 AI 中台,优图实验室在传统广电领域积累了大量的媒体资源,其中又以视频内容为主,这些视频往往要管理、搜索、利用,这是很困难的。通过多模态技术,对这些视频的内容进行完整深入理解,并进行标签化配备,以方便后续的管理、搜索及利用。
  • 内容审核平台,由于在不同的行业中,对于内容违规的定义和尺度是不同的,因此优图不仅是在内容审核层面提供了相关 AI 自动审核等能力,还提供了一整套的运营平台。
  • 工业 AI 平台,机器视觉在工业领域有非常多的应用,且大多需要根据不同场景采取定制化方案。工业 AI 平台是囊括【从数据搜集和标注到自动化训练,到模型的自动封装、自动部署、自动评测】的这样一个完整的流程,从而帮助更多的工业产业提升效能。

AI 向善,正在表现得淋漓尽致

优图实验室深知,人工智能的最终目的是服务于人类社会。因此在社会公益方面,优图首创跨年龄人脸识别技术,重点解决寻人场景中婴幼儿被拐的情况。

2019 年 4 月,优图与腾讯守护者计划联合团队先后协助四川、广东深圳两地警方开展专项行动,成功找回了多名被拐 10 年 + 的儿童,其中被拐最长时间已达 18 年。此前,优图通过人工智能技术协助寻亲已有不少成功经验。截至 2018 年 10 月,接入优图技术的 QQ 全城助力累计找回 600 多人;截至目前,使用该技术的福建省公安厅“牵挂你”防走失平台截止 19 年 9 月累计找回 1081 多人。

让 AI 能够真正惠及人类社会,才是 AI 的最终价值。

让 AI 惠及更多的产业

腾讯高级执行副总裁、云与智慧产业事业群总裁汤道生在会上强调”让 AI 惠及更多的产业“,随之而来的,则是腾讯已经建立起了以【人工智能为核心的实验室矩阵】以及【前沿科技为核心的实验室矩阵】的两大技术底座,相信在产业互联网在 AI 能力的加持下,势必迸发出更强的价值。

而我们也十分期待优图实验室,在人工智能这片广阔蓝海下的未来作为。