上周三,谷歌推出了该公司认为最强大的人工智能模型Gemini,向竞争对手OpenAI的大模型GPT-4发出挑战。Gemini的发布令华尔街欢呼雀跃。然而,热度才持续没多久,谷歌发布的一段展示Gemini强大能力的视频却被质疑造假,让该公司陷入“虚假宣传”的风波。
谷歌上周四在YouTube官方账号发布了一个名为“与Gemini亲密互动:与多模态AI交互”的视频,引发了大量网友围观。
这段6分钟的视频包括用户和Gemini驱动的聊天机器人之间的口头对话,还展示了Gemini识别视觉图片和物理对象,并区分它们的能力。其中一些功能令人印象深刻。Gemini似乎能够快速识别图像,并在几秒钟的时间内做出反应。
例如,在第一个演示中,Gemini识别了一个鸭子素描从一条线到完整画面的演变过程。当演示者将鸭子素描填满蓝色颜料时,Gemini指出鸭子通常是棕色、白色或黑色的,不会是蓝色的。
另外,Gemini能够仅凭一些毫无规则的点就推断出绘制内容是一只螃蟹,显示出这一大模型强大的推理能力。
然而,这段视频发布仅一天,外界就开始质疑谷歌对Gemini的功能造假。有人质疑,该视频并非实时录制,而是多轮尝试并精心挑选和剪辑而成。
质疑声之一来自彭博专栏作家帕米·奥尔森(Parmy Olson),他认为,在谷歌发布的这段视频中,Gemini似乎非常强大,但有点过于强大了。
谷歌承认视频系剪辑合成
面对质疑,谷歌也向媒体证实,这段关于Gemini性能演示的视频并不是实时的,而是使用了原始镜头中的静止图像帧,然后编写了文本提示,以便让Gemini做出回应。
Google DeepMind产品副总裁 Eli Collins表示,影片中的画鸭子演示 (画一个鸭子的简笔画,Gemini可以对每一步骤做出正确的解释)确实是研究等级的功能,至少目前还没有出现在谷歌的实际产品中。
实际上,根据YouTube上的视频描述,可以发现谷歌有一个重要的免责声明,“出于本演示的目的,为了简洁起见,延迟已经减少,Gemini输出也已缩短。”这意味着Gemini真实的响应时间实际上比视频中展示的时间要长。
谷歌太过急于求成?
对于这段视频,有谷歌员工向媒体透露,这描绘了一幅“不切实际的画面”。员工还表示,对谷歌的这种夸张演示并不感到惊讶,他们已经习惯了公司会对产品在某种程度上进行夸大营销。
这似乎表明,面对AI方面落后于最强大的竞争对手,谷歌正急于推出一款产品来赶超。
奥尔森就此提出批评,在这种情况下,谷歌是在“炫耀”,目的是误导人们,让他们忽视 Gemini 仍然落后于OpenAI的GPT的事实。
谷歌正与微软支持的OpenAI的GPT-4展开激烈竞争,后者是迄今为止最先进、最成功的模型。谷歌上周声称Gemini最强大的版本“Ultra”在多项测试中表现均优于GPT-4。
今年早些时候,面对OpenAI的ChatGPT风靡全球,谷歌草草推出AI聊天机器人巴德,被员工指责称这一行动“仓促”、“拙劣”。
编辑/范辉