OpenAI在大约一年前首次推出人工智能聊天机器人ChatGPT,随后人工智能大模型开始在全球爆发,微软、谷歌、亚马逊等全球科技巨头在过去一年里不断加大对人工智能的投入,在大模型领域展开激烈竞逐。
谷歌的Bard、Anthropic的Claude、微软的CoPilot,这些大模型的用户数量都在过去几个月里激增。 然而,直到目前,OpenAI的ChatGPT仍是全球范围最受欢迎的AI聊天机器人,占据了最大的市场份额。
另一方面,近期OpenAI的高层人事震荡也反映出聊天机器人背后的安全伦理问题,竞争对手正在针对OpenAI的安全缺陷推出更优的解决方案。
全栈对标OpenAI和微软
由于ChatGPT等应用程序主要运行在云端,包括微软、AWS和谷歌在内的云计算服务供应商都在对AI大模型等人工智能技术进行巨额投资,以提升其云计算能力,并帮助企业承担更多的人工智能工作负载。
Nvidia 成为第一家也是唯一一家加入 1 万亿美元估值俱乐部的芯片公司,并且由于其作为用于为 ChatGPT 和其他生成 AI 应用程序提供动力的芯片的主要供应商的地位,被广泛认为是 AI 热潮的最大赢家。
由于这些应用程序主要运行在云端,包括微软、亚马逊和Alphabet在内的云计算服务供应商的股价也大幅上涨。
在今年的亚马逊云科技AWS reInvent大会上,AWS推出的所有产品几乎都直接针对OpenAI及其支持者微软,从最底层的人工智能基础设施,到中间层AI大模型服务,再到最顶层的人工智能应用程序,AWS正在加速构建自己的大模型生态。
AWS CEO亚当·塞利普斯基(Adam Selipsky)说道:“我们认为生成式AI实际上有三个宏观层次,这是一个堆栈,最底层是用来训练基础模型,并在生产环境中运行这些模型;中间层提供了访问这些模型的能力,以及用来构建和扩展生成式AI应用程序的工具;在最顶层是使用这些模型构建的应用程序。”
有分析师认为,AWS和微软Azure在生成式人工智能的技术堆栈方面非常相似。因为微软Azure也构建了从基础设施到顶层应用到一整个堆栈。
在顶层应用程序方面,AWS推出的重磅企业级聊天机器人产品Amazon Q不仅在名字上与OpenAI被曝光的“Q计划”不谋而合,而且就连功能也几乎与ChatGPT Enterprise以及微软的Copilot Studio非常类似。Copilot Studio基于OpenAI的模型构建,使用户能够创建独立的Copilot、自定义GPT、添加生成式AI插件等。
在中间层的生成式AI服务方面,AWS宣布其AI大模型服务Amazon Bedrock代理普遍向客户开放,这能使模型针对特定用例进行定制和优化。此外,Bedrock也推出了包括微调工具、检索增强生成(RAG)等新技术,其中英伟达的Nemo LLM大模型框架用于RAG推理模型检索。
除了托管Anthropic、Stability AI、Cohere、AI21 Labs和Meta等大模型服务外,AWS也宣布正在构建自己的大模型Titan,并推出了最新的Titan Image Generation文生图工具。
而在底层基础设施方面,AWS和微软Azure都在加大投资自研芯片。塞利普斯基在reInvent大会上对话了两个重量级人物,其中一位是英伟达创始人CEO黄仁勋。
黄仁勋对AWS在芯片基础设施方面投资的前瞻性给予高度评价。他表示:“AWS是世界上第一个认识到GPU加速计算重要性的云。很久以前,AWS就把世界上第一个GPU放在云上。”
黄仁勋提到了一个统计数据,并称这是“惊人的”。他说仅在过去几年中,AWS在云中部署了200万个使用Ampere和Hopper架构的GPU,这相当于一个3000exaFLOPS(3ZFLOPS)运算性能的超级计算机。
他进一步解释道,拥有一台百亿亿级次浮点运算性能(1exaFLOPS)的超级计算机就非常令人羡慕,而AWS相当于拥有3000台这样的超级计算机。“这才只是一个开始。”黄仁勋称,“我们与AWS的合作仍在以惊人的速度增长。每个季度,我们都会为AWS部署超过1ZFLOPS的计算能力,这是一个令人难以置信的数字,我们两个团队建立了一整套新的基础设施。”
加持Anthropic
塞利普斯基对话的另一位是Anthropic联合创始人兼CEO 达里奥·阿莫代伊(Dario Amodei),这两家公司与AWS的关系非常紧密,英伟达最近一个季度数据中心收入的一半贡献者是AWS,而Anthropic则是AWS今年9月斥资40亿美元收购的AI头部企业,该公司的大模型Claude直接与OpenAI的GPT竞争。
阿莫代伊毫不掩饰与OpenAI的竞争关系。他说道:“Anthropic的创始人是一群曾在OpenAI工作多年的人,我们开发了诸如GPT-3、基于人类反馈的强化学习、语言模型的规模化定律等理念,这些都是当前生成式AI热潮背后的一些关键理论。”
他特别强调,Anthropic成立的理念不仅是创建安全、可靠、可控的人工智能模型,同时在内容生成、概括总结、问答、复杂推理等领域拥有很强的能力。“目前全球约有一半的财富500强公司正在使用或测试Claude大模型。”阿莫代伊表示。
OpenAI数据显示,目前每周用户数量达到1亿,自今年3月发布ChatGPT的API功能以来,该公司现在已拥有超过200万开发人员,其中超过92%来自财富500强公司。
AWS在巨额注资Anthropic的同时,也宣布了与Anthropic增强战略合作关系,后者将AWS作为执行关键任务工作负载的主要云服务提供商,并将在亚马逊云科技上训练和部署Claude以及未来一代的基础模型。
塞利普斯基就Anthropic和AWS之间的关系未来如何发展向阿莫代伊提问。阿莫代伊表示:“我认为未来双方的合作主要涉及三方面,首先是计算方面,第二是向客户提供服务方面,第三是硬件方面,主要是Trainium和Inferentia芯片等。将这三个层面的技术栈结合起来,将可能真正允许我们一起为客户提供过去无法实现的东西,比如模型的定制化、使用专有数据和独特的微调功能。”
就在上周,Anthropic发布了最新版本大模型Claude 2.1,带来了许多关键能力的新进展,对此,阿莫代伊透露,最新版Claude减少了过去的大模型所谓的“幻觉”显现。“所谓的幻觉是指模型说出不真实的事情,我们已经将这类现象的发生率大幅减少。”他表示,“我们在整个行业中看到,大模型部署到企业的一个核心障碍是人们担心模型会说出不真实的事情,我们在减少这些问题方面走在了前列。”
值得关注的是,除了在大模型的性能方面,Anthropic正在与OpenAI进行“头对头”的竞争,该公司还强调自己的使命是以更负责任的态度构建通用人工智能AGI。“我们的研究组织中很大一部分工作都在研究人工智能的安全性。”阿莫代伊表示,“我们投入了大量工作,使我们的模型难以被破坏,并能对滥用和有害使用进行防御。”
阿莫代伊援引卡内基梅隆大学最近的一项研究数据称,在尝试对不同模型进行对抗性破坏时,他们发现成功破坏Claude大模型的次数比竞争对手的模型少了十倍。他指的竞争对手无疑是GPT大模型。“所以这里确实有实质性的区别。”阿莫代伊表示。
“负责任的人工智能”
就在上周,美国、英国和其他十几个国家公布了一份关于如何保护人工智能免受侵害的国际协议,其中特别强调推动企业创建“设计安全”。协议指出,设计和使用人工智能的公司需要以确保客户和广大公众免受滥用的方式开发和部署人工智能。
“负责任的人工智能”(Responsible AI)也是AWS在今年reInvent大会上特别强调的,例如AWS新推出的Guardrail防护栏功能,可以让用户通过自然语言描述来输入希望大模型避免的话题,来保护生成式AI应用,防止被滥用。
OpenAI的人事震荡反映了不同阵营对改变世界的AI的安全性分歧已经暴露出来,人工智能未来的发展也将面临严峻的挑战。一方面,以奥尔特曼为代表的一群“激进派”人士认为人工智能的快速发展,尤其公共部署对于AI的压力测试和完善技术至关重要;而以该公司另一名联合创始人、首席科学家苏茨克维尔 (Ilya Sutskever)为代表的另一方则认为,最安全的前进道路是先在实验室里全面开发和测试人工智能,以确保它对人类来说是安全的。
塞利普斯基指出了OpenAI的安全性缺陷,并提出AWS的应对方案。“生成式AI必须具有企业级的安全功能,以保护数据的安全和隐私,我们不会使用任何客户数据来训练或改进原始的基础模型。”塞利普斯基反复强调,“我们会把模型放在一个安全的容器中,它不会去任何地方,你的数据永远不会暴露在公共互联网上,永远不会离开AWS云,对它的访问都受到限制。”
他还谈到Amazon Bedrock的各种监管治理标准,例如将完全符合GDPR的要求。“在解锁生成式人工智能全部潜力的同时,我们也必须找到降低风险的方法。现在,应对这个挑战将需要前所未有的合作,包括科技公司、政策制定者、社区团体、科学社区和学术界的真正多方利益相关者的努力。”塞利普斯基表示。
今年早些时候,塞利普斯基和阿莫代伊都加入了拜登政府人工智能安全性的倡导,作出一系列自愿承诺,以促进安全和透明的人工智能技术的发展;他还参加了英国的AI安全峰会。他补充道:“负责任的人工智能的一个重要组成部分是促进消费者与应用之间的交互,而这些交互必须是安全的,避免有害的输出,并且符合公司的指导方针。”
生成式AI也引发了版权方面的争议,OpenAI及其支持者微软已遭受多起版权所有者团体提起的诉讼。为人工智能生成图像添加水印,或者将内容识别为人工智能生成的内容,也是拜登政府人工智能行政命令的关键部分。 为了解决这个问题,微软和Adobe等公司都采用了内容来源和真实性联盟 (C2PA) 开发的内容凭证系统。
AWS也最新宣布将文生图应用Titan Image Generator中的所有图像都自动添加了隐形水印。AWS生成式人工智能副总裁Vasi Philomin对第一财经记者说道:“我们从设计一开始,就想要一种方法来标记由人工智能创建的图像,并且不会干扰视觉,没有延迟,并且不能被裁剪或压缩。我们创建了一个API,人们可以通过连接API,然后提供图像来检查图像的出处。”
编辑/樊宏伟