Categories
程式開發

OpenAI 推出商业化文本生成器,曾因“太危险”而中止发布


本文最初发表在 WIRED 网站,由InfoQ 中文站翻译并分享。

OpenAI 成立的初衷是为了引导人工智能远离有害用途。现在,它正与科技巨头竞争,向企业出售云计算服务。

去年春天,人工智能研究机构 OpenAI 表示,它开发的软件非常擅长生成文本(包括虚假新闻),以至于认为它太过危险,不能发布。后来,两个刚毕业的硕士研究生重新创建了这种软件,OpenAI 就发布了原版软件,声称公众对风险的意识已经增强,并没有看到滥用的证据,这个限界很快就消失了。

现在,OpenAI 实验室又推出了功能更强大的文本生成器,以及新的营销口号:http://Pay us to put it to work in your business.”>给我们付钱,我们就能将它用在你的业务上。周四,OpenAI 推出了一项云服务,一些公司已经在使用这项服务来改进搜索或提供数学问题答案的反馈。这是对人工智能编程新方式的测试,也是对该实验室不同寻常的商业模式的测试。

OpenAI 是 Elon Musk 和其他硅谷知名人士在 2015 年成立的非营利机构,以确保未来的超人类人工智能是一股良性力量。Tesla 首席执行官在 2018 年与 OpenAI 实验室分道扬镳,去年它成为一家盈利性公司,并从 Microsoft 那里获得 10 亿美元的投资。OpenAI 的领导人声称,只有将其研究商业化,使投资者受益,才能筹集到所需的数十亿美元资金,跟上人工智能前沿的步伐。

周四,OpenAI 的首款商业产品的发布完成了这种蜕变。一家为在超人类人工智能上与科技巨头竞争而成立的研究机构,如今在正在向企业销售云服务这一更为平凡的领域向他们发起挑战。

OpenAI 的服务建立在机器学习技术的基础上,在过去两年里,这项技术使计算机在语言方面有了很大的提高。机器学习算法的目的是分析从网络上收集的大量文本,从而发现语言使用的统计模式。然后,可以对软件进行优化,以执行诸如回答事实问题或总结文档之类的任务。

Google 已经利用这项技术来改善其搜索引擎处理长问句查询的方式,而 Microsoft Office 则利用这项技术来发现语法错误。OpenAI 致力于将这项技术推向更大的规模,并开发能够生成文本的软件。只要给出一小段文字,它就会建立在这一小段文字的基础上,解出具有类似统计特性的句子。尽管有时会与现实脱节,但结果也可能会无比流畅

像这样的文本生成器可能很有趣,在这里试一下吧,但是在之前还没有看到太多的商业用途。OpenAI 首席执行官 Sam Altman 表示,最新一代的产品功能强大,而且足够灵活,适合用于实际工作。他称:“这是我们第一次有了我们认为足够好的东西,可以开发成产品。”

OpenAI 的新文本生成器使用了从网络和数字化书籍中收集的近万亿单词,在一台超级计算机上进行训练。这台超级计算机上有数十万个处理器,是 OpenAI 付款给 Microsoft 建造的,有效地将公司 10 亿美元投资的一部分返还给了它的来源 — Microsoft。

“这些模型有些不可预测。”
——Robert Dale,Language Technology Group

与大多数人工智能云服务相比,OpenAI 的服务更具开放性,别家人工智能云服务通常只执行一项任务,例如翻译或图像标记,并由特定命令控制。如果程序员希望利用 OpenAI 的技术,只需提交人类可读的文本,就可以得到新生成的文本。

这听起来可能有些局限性,但是通过精心设计正确的输入,软件就有可能执行不同的任务。我们的目标是尝试并反复推敲,以模仿出互联网的某个特定部分上对统计语言模式。

提交为小学生改写的段落范例,然后再提交一段不简单的文字,这会促使服务将其改写,使其更容易阅读。该服务可以回答事实问题或充当聊天机器人,如果提供问答对或对话的例子,可以引导软件利用其事实陈述或对话的经验。

OpenAI 首席技术官 Greg Brockman 表示:“人们最大的心理转变是,它更像是在和人类交谈,而不是为机器格式化东西。你给它几个问题和答案,突然间,它就进入了问答模式。”

Nick Frosst 是一名致力于语言机器学习的研究员,曾在 Google 工作,他说这种与人工智能打交道的新颖方式可以拓宽语言技术实验人员的范围。“能做到这一点,真让人兴奋,”他表示,“这是大多数人认为人工智能应该工作的方式。”

OpenAI 提供为期两个月的免费服务,目前已经拥有一些用户。Algolia 是一家为应用程序和网站建立内部搜索引擎的初创公司,用 OpenAI 的服务来提高对复杂搜索字符串的理解。

其他人则在使用一项附加服务,即 OpenAI 通过附加的数据将软件的一个版本“微调”到特定的任务。数学教育网站 Art of Problem Solving 就利用这一功能向学生提交的意见提供建议,从而加快评分者的工作进度。

尽管早期就有这样的兴趣,但 OpenAI 领导者坦言,目前还远不清楚这种新的人工智能编程模式的用途能有多广泛。

其中一个未知就是它的可靠性。咨询公司 Language Technology Group 的 Robert Dale 说,“这些模式在某种程度上是不可预测的。”OpenAI 的软件可以重现文本模式,但对世界缺乏常识性的理解。它的多功能性可以是一种负债,也可以是一种资产。偶尔的杂音对某些用途来说影响不大,比如预测性文本,但在其他用途中(比如客户支持聊天机器人)可能会造成严重后果。

关于 OpenAI 的技术,有一点是肯定的,那就是它会说脏话。它在互联网上的大量训练使得这个软件非常精通令人不快的语言,比如随意的或攻击性的种族主义言论,并且它可以被提示重新创建这些语言。其结果可以让人联想到 Twitter 用户如何怂恿臭名昭著的 Microsoft 聊天机器人 Tay 发表种族主义言论

当《连线》杂志(WIRED)在留言板 4chan 上提供了两句话,指责共和党人“没有骨气”,没有对“Clinton、Pedos、审查制度或骚乱”采取行动时,OpenAI 的服务就“升级”了,反复说“我们正在遭受殴打和强奸……大量的移民从 60 年代开始,从未停止过。”

OpenAI 表示,它将对客户进行审查,以防有人使用该服务进行垃圾邮件或骚扰之类的行为。一些客户已经构建了过滤器以阻止这些技术产生的有毒语言。OpenAI 也在致力于开发自己的安全功能。

Altman 并不认为 OpenAI 的产品能够马上盈利,但他说,随着实验室的不断改进,它有望在几年内发展成一个重要的收入来源。Microsoft 在该实验室的持股也可能会有所帮助。OpenAI 在 Microsoft Azure 云计算平台上构建了这项新服务;如果 Microsoft 将其作为人工智能服务提供,OpenAI 将会得到更广泛的应用。

Altman 承认有可能与 Microsoft 建立更为密切的关系,但拒绝详细说明。当《连线》杂志提示实验室的新软件填写“OpenAI 和 Microsoft 的第一个商业合作项目”的细节时,它描述了一个“名为 Copilot 的游戏,可以让两个人玩赛车游戏,其中一个人控制油门踏板,另一个人控制刹车。”

作者介绍:

Tom Simonite,是旧金山《连线》(WIRED)杂志的资深撰稿人,主要报道人工智能及其对世界的影响。他曾任《麻省理工科技评论》旧金山分社社长,并在伦敦的《新科学人》(New Scientist)杂志撰写和编辑技术报道。在剑桥大学获得学士学位,在伦敦帝国学院获得硕士学位,现居旧金山。

原文链接:

https://www.wired.com/story/openai-text-generator-going-commercial/