“拍卖就像一把发令枪”,一段涉及百度的AI秘史
北京青年报客户端 2021-03-19 17:31

2013年3月,Google花费4400万美元收购了多伦多大学的一家初创公司 DNNResearch。 

这家公司在当时不仅没有任何产品,也压根没有生产产品的计划。它只有三位员工:当时已经六十余岁的多伦多大学计算机系教授 Geoffrey Hinton,和他的两个学生 Alex Krizhevsky 和 IIya Sutskever。有人调侃,Google花费数千万美元,只是买到了几篇论文。 

但之后科技行业的发展证明了Google的眼光。深度学习从边缘学科一跃成为显学,而这一学派的开山祖师正是Geoffrey Hinton。因为在深度学习上的突出贡献,他在2018年获得了图灵奖。Hinton成了AI领域举足轻重的人物,中国互联网也习惯于为他“封神”,称呼他为“AI教父”、“深度学习之父”等。而Google因为有了Hinton,成为AI技术最出色的公司之一。 

但这场收购的细节鲜少被外界了解。事实上,Google并不是最初“发现”Hinton的公司,最早意识到Hinton和他在深度学习上的研究价值的,其实是一家中国公司——百度。 

在3月16日发布的一本新书《Genius Makers: The Mavericks Who Brought AI to Google, Facebook, andthe World》(天才制造者:那些将 AI 带到 Google、Facebook和全世界的特立独行者,下称《天才制造者》)中,《连线》杂志资深撰稿人Cade Metz揭开了这一段鲜为人知的“秘史”。这本书记录了Google、Facebook和百度等公司在AI上的你争我夺,并试图解释为何AI注定会变成一个中美之间的新军备竞赛。而全书的开篇,就从这场被形容为“今天所有AI领域故事的开端”的竞拍开始。 

百度与Hinton曾接近达成协议

Cade Metz通过大量采访,还原了2012年Hinton主导的一场拍卖。当年12月,在美国内华达州边界的太浩湖旁,举办了每年一届的NIPS。NIPS全称Neural Information Processing Systems(神经信息处理系统),是AI领域的顶级会议。

2012年那一届 NIPS,对多伦多大学教授Hinton和他两个学生来说,意义尤为不同。他们在会议酒店的房间里,举办了一次线上拍卖会。美国科技巨头Google和微软,中国科技巨头百度以及英国的AI初创公司DeepMind,用竞拍的方式争夺 Hinton刚刚成立的、没有任何产品的小公司DNNResearch。

这些公司中,百度其实是最早接触 Hinton 的公司。

2012年秋天,Hinton和学生们发表了一篇长达9的论文《ImageNet Classification with Deep Convolutional Neural Networks》。这篇论文提到的Alexnet引入了全新的深层结构和dropout方法,在ImageNet图像识别大赛中,将错误率从25%以上提升到了15%,获得了第一名。

那一年的ImageNet比赛,Google也在数据集上做了内部测试,也用了深度学习方法,但识别精度比Hinton团队差了很多。Google拥有大多数团队无法企及的硬件和数据资源,但却输给了一个学界的团队。这让工业界感到吃惊,大大促进了深度学习的传播。

这个事情在今天来看,也是一个AI技术发展的历史性转折时刻。但当时还只有很少人意识到它的意义。而就在论文发出没几天,Hinton收到了一封来自中国的电子邮件。

这封邮件的发出者是百度。这一年,百度开始大规模采购和建立GPU运算集群,开发了世界上第一个支持GPU&CPU的并行深度学习平台。10月,李彦宏了解深度学习方面的进展,知道了Hinton。

当时Hinton远没有今天知名,但百度决策很快,李彦宏安排当时负责百度战略投资的副总裁汤和松与Hinton取得联系,并直接提出邀约。百度提出的方案是,出价1200 万美元聘请Hinton及其学生,合约期三年。双方进展很快。

但在眼看要达成协议前,Hinton的那两名学生“拦住”了Hinton,在他们的建议下,Hinton意识到,与招聘“三个新员工”相比,百度和其他公司显然更可能为收购一家公司付出更可观的资金。

Hinton问百度,自己可否评估一下其他邀约。而原本已经接近谈成的百度,同意了。

“当百度同意后,Hinton彻底颠覆了局面。”《天才制造者》的书中写到。Hinton 立刻创建了只有他和那两名学生的初创公司——DNNresearch。

据《天才制造者》的记录,Hinton当时特意询问了一位多伦多的律师,如何能让一家只有三名员工、没有产品、几乎没有历史的初创公司的价值最大化。律师给了他两个选择:聘请专业谈判代表,但会有激怒买家的风险。或者,进行一次拍卖。

Hinton选择了后者,于是,共有四家公司加入了竞拍:最先找到Hinton且本已接近拿下的百度,以及在百度之后也开始给Hinton家频繁打电话的Google和微软,以及一家当时刚刚成立两年的伦敦初创公司——DeepMind。这家公司后来被 Google所收购,研发出大名鼎鼎的AlphaGo。

作为最早接触Hinton的公司,百度看到事情变成和多家美国公司的竞争后,已经预感到了最终结局。

出价最高的百度没有赢得竞拍

Hinton和学生们在酒店房间里“举办”了拍卖会——它通过Gmail进行,四家公司的高管远程出价,从加利福尼到伦敦再到北京。Hinton将每个竞拍者的身份隐藏了起来,他们相互不知道对方是谁。

微软首先对这种竞拍方式提出疑问,他们不喜欢用Gmail来竞拍,认为Google可能会偷偷读取邮件。Hinton和学生们商量过后,依然采用这种方式,他们“相当确信Google不会读取Gmail”。

Hinton对Google的好感已经很明显。

Google对深度学习的兴趣,很大程度也受到Hinton的影响。2006 年Hinton 发表了论文《A fastlearning algorithm for deep belief nets》(深度信念网络的一种快速学习算法)。这篇论文发表之前,没有人知道怎么训练深度神经网络,因此这个领域鲜有人问津。该论文提出了一种训练深度网络的方法,对每一层网络先进行预训练,然后再微调,网络的学习速度大幅提高。

这篇论文成为开启深度学习热潮的一个因素,Google等公司开始注意到深度学习。另一个重要的因素是算力。2009年,计算机的算力发展到足以挖掘庞大的数据库,神经网络在语言和图像识别方面,开始胜过基于逻辑的传统计算机。

Google也在那时开始投资AI。2010年,当时还是斯坦福大学教授的吴恩达与Google 里颇具声望的高级研究员Jeff Dean一起,建立一个名为Project Marvin(以著名的AI先驱马文・明斯基命名)的项目,以研究神经网络。后来,一些Google工程师开始用Google Brain称呼Project Marvin。

这个项目成果之一,是大型深度学习软件平台DistBelief。包括Google 搜索、Google 地图和 YouTube 在内的50多个团队,利用 DistBelief 来改进产品。

2012年,Google X宣布建立了一个包含16000个计算机处理器的神经网络,并在 YouTube上部署。这个神经网络通过学习YouTube上大量包含猫的、未标记的视频,识别出了“猫”这种生物。

这在当时是一个重要突破。“在训练中我们从来没有告诉过神经网络,这是一只猫。”Jeff Dean说,“它基本上发明了猫的概念。”

Google在这次拍卖中也势在必得。Hinton设计的拍卖规则很简单。每次竞价后,四家公司有一个小时将购买价格提高至少100万美元。这一个小时从最新竞价的邮件上的时间戳开始。一个小时结束后,如果没有人提出新的竞价,拍卖就结束了。

Hinton每天会为下一轮竞价设定一个时间,到了指定的时间,他和学生聚集在他的房间里,看着笔记本电脑上出现的竞价。数字开始飞快攀升。

DeepMind用公司股票而非现金竞拍,因此很快就退出了。这似乎也预示了它在之后被Google收购的结局。而在价格飙到2000万美元时,微软也退出了。但它随后又回来了一次,然后再次退出。

事实上,微软在此之前已经邀请Hinton担任过顾问。

微软对深度学习的研究,依托雷德蒙德研究院展开。2009年11月至12月期间,当时在研究院里关注深度学习的华裔科学家邓力,邀请Hinton为雷德蒙德研究院进行咨询,研究如何将深度学习方法应用于语音特征编码和语音识别问题。

此前的语音识别模型一直处于非常令人沮丧的“局部最优”状态,准确率很难大幅提升。在读过Hinton2006年发表的两篇开创性的论文后,邓力产生了将深度学习引入语音识别的想法。

在 Hinton为微软咨询期间,他和邓力一同开发了深层信念网络的方法“食谱” 及在语音特征提取上的应用。这种方法使得大规模语音识别系统的错误率大幅减少,2011年微软公布这一成果时,业界大为惊叹。

而邓力就是代表微软在那次拍卖中出价的那个人。

看着飞升的金额,Hinton和他的学生们不停争论他们更愿意加入哪家公司。

《天才制造者》中甚至记录了一段“迷信”的对话。一天午后,当他们望向窗外时,两架飞机从相反方向飞过,在天空中留下的烟道,就像一个巨大的X,正好在一组山峰之上。他们思索着这可能意味着什么,然后才想起Google的总部就在一个叫山景城的地方。“这是不是意味着我们应该加入Google?”Hinton问道,“还是说我们不应该?”

在2200万美元左右时,Hinton暂时中止了拍卖,与其中一个竞拍者进行讨论,半小时后,微软又退出了。

最后剩下百度和Google。随着时间推移,两家公司依然在抬高价格。但当价格达到2400万美元时,百度的一位高管从北京接手,并且愿意给出更高的价格:2500万美元、3000万美元、3500万美元。

Hinton将竞价窗口从一个小时缩短到30分钟。竞价迅速攀升到4000万美元、4100万美元、4200万美元、4300万美元。“这感觉就像我们在拍电影一样。”他说。一天晚上,接近午夜时分,当价格达到4400万美元时,他又暂停了竞价。《天才制造者》中这样记载。

第二天,在竞标恢复前约30分钟,Hinton发了一封邮件,说开始时间会推迟。大约一个小时后,他又发了一封:拍卖结束了。

事实上,在前一天晚上的某个时刻,Hinton已经决定将他的公司卖给Google。他给百度的邮件中说,公司发送的任何其他信息都会转发给他的新雇主,不过他没有说那是谁。

《天才制造者》中写到,Hinton后来承认,这是他一直想要的。因为对他来说,为他的研究找到合适的归宿,比获得最高竞标价格更重要。

《天才制造者》也写到,百度猜到Hinton最终会在Google,或者至少是另一家美国公司工作。毕竟他的背部不好,无法前往中国。他在十几岁时受了背伤,到五十多岁时,已经无法坐下,否则会有椎间盘滑落风险。他不得不一直站着办公,出远门也不坐飞机,因为飞机起飞降落时不允许站起来。

书中写道,通过把美国竞争对手逼到极限,百度高层已经意识到深度学习在未来几年的重要性。

“拍卖就像一把发令枪。”《天才制造者》中这样写到,在那次竞拍结束后,新的竞争已经开始了。

文/北京青年报记者 温婧
编辑/田野

相关阅读
《以实践为舵、以自律为帆》今晚播出 “国家卓越工程师”王海峰讲述百度AI研发背后的故事
北京青年报客户端 2024-08-14
苹果手机将搭载百度AI技术?百度人工智能A股小伙伴有这些
财联社 2024-03-25
信通院最新AI人才竞争力报告:百度七大领域均排名第一
北京青年报客户端 2023-07-28
百度李彦宏:算力能买但创新不能买
第一财经 2023-05-06
AI行业上演“百团大战” 开出百万年薪招兵买马
北京青年报客户端 2023-04-11
中兴服务器将支持百度“文心一言”产品
北京青年报客户端 2023-03-16
巨人网络今日确认接入百度“文心一言”
北京青年报客户端 2023-02-20
陆小曼未完的山水画遗作,被AI接续画完且成功拍卖
扬子晚报 2022-12-10
最新评论