Categories
程式開發

王海峰详解百度NLP十年技术完整布局


自然语言理解(NLP)素有“人工智能皇冠上的明珠”盛誉,这也意味着语言与知识等认知层面的技术突破将进一步促进AI深入发展。AI在向更深层次进化,语言与知识技术的重要性愈加凸显。语言与知识技术是人工智能认知能力的核心,以语言和知识为研究对象,让机器像人一样掌握知识、理解语言的自然语言处理技术,对于人工智能发展至关重要。

百度NLP十年,完成技术布局已经形成

8月25日,在百度大脑语言与知识技术峰会上,百度CTO王海峰全面分享了百度语言与知识技术完整布局和最新成果。

王海峰详解百度NLP十年技术完整布局 1

首先,知识图谱是机器认知世界的重要基础,百度打造了大规模知识图谱,拥有超过50亿实体和5500亿事实,并在不断演进和更新。百度知识图谱应用于各行各业,每天的调用次数超过400亿次。

王海峰详解百度NLP十年技术完整布局 2

其次,在融入知识的基础上,语言理解能力不断增强。2019年3月,百度提出知识增强的语义理解框架ERNIE,在深度学习的基础上融入知识,同时具备持续学习能力,曾登顶全球权威数据集GLUE榜单,首次突破90分,刷新榜单历史。基于知识图谱和语义表示,突破了阅读理解、对话理解以及跨模态深度语义理解等技术。

第三,语言生成是语言与知识技术中的重要组成部分。基于预训练技术的经验,百度提出基于多流机制的语言生成预训练技术,兼顾词、短语等不同粒度的语义信息,显著提升生成效果。百度也探索了多文档摘要生成,通过图结构语义表示引入篇章知识,在单文档和多文档摘要生成效果都有提升。

原文链接:【https://www.infoq.cn/article/u8dNES5eRwcHraAVeuVo】。未经作者许可,禁止转载。