北京青年报

Gemini终究难敌GPT-4？谷歌陷“虚假宣传”风波承认演示视频系剪辑合成

财联社 2023-12-11 10:23

上周三，谷歌推出了该公司认为最强大的人工智能模型Gemini，向竞争对手OpenAI的大模型GPT-4发出挑战。Gemini的发布令华尔街欢呼雀跃。然而，热度才持续没多久，谷歌发布的一段展示Gemini强大能力的视频却被质疑造假，让该公司陷入“虚假宣传”的风波。

谷歌上周四在YouTube官方账号发布了一个名为“与Gemini亲密互动：与多模态AI交互”的视频，引发了大量网友围观。

这段6分钟的视频包括用户和Gemini驱动的聊天机器人之间的口头对话，还展示了Gemini识别视觉图片和物理对象，并区分它们的能力。其中一些功能令人印象深刻。Gemini似乎能够快速识别图像，并在几秒钟的时间内做出反应。

例如，在第一个演示中，Gemini识别了一个鸭子素描从一条线到完整画面的演变过程。当演示者将鸭子素描填满蓝色颜料时，Gemini指出鸭子通常是棕色、白色或黑色的，不会是蓝色的。

另外，Gemini能够仅凭一些毫无规则的点就推断出绘制内容是一只螃蟹，显示出这一大模型强大的推理能力。

然而，这段视频发布仅一天，外界就开始质疑谷歌对Gemini的功能造假。有人质疑，该视频并非实时录制，而是多轮尝试并精心挑选和剪辑而成。

质疑声之一来自彭博专栏作家帕米·奥尔森（Parmy Olson），他认为，在谷歌发布的这段视频中，Gemini似乎非常强大，但有点过于强大了。

谷歌承认视频系剪辑合成

面对质疑，谷歌也向媒体证实，这段关于Gemini性能演示的视频并不是实时的，而是使用了原始镜头中的静止图像帧，然后编写了文本提示，以便让Gemini做出回应。

Google DeepMind产品副总裁 Eli Collins表示，影片中的画鸭子演示（画一个鸭子的简笔画，Gemini可以对每一步骤做出正确的解释）确实是研究等级的功能，至少目前还没有出现在谷歌的实际产品中。

实际上，根据YouTube上的视频描述，可以发现谷歌有一个重要的免责声明，“出于本演示的目的，为了简洁起见，延迟已经减少，Gemini输出也已缩短。”这意味着Gemini真实的响应时间实际上比视频中展示的时间要长。

谷歌太过急于求成？

对于这段视频，有谷歌员工向媒体透露，这描绘了一幅“不切实际的画面”。员工还表示，对谷歌的这种夸张演示并不感到惊讶，他们已经习惯了公司会对产品在某种程度上进行夸大营销。

这似乎表明，面对AI方面落后于最强大的竞争对手，谷歌正急于推出一款产品来赶超。

奥尔森就此提出批评，在这种情况下，谷歌是在“炫耀”，目的是误导人们，让他们忽视 Gemini 仍然落后于OpenAI的GPT的事实。

谷歌正与微软支持的OpenAI的GPT-4展开激烈竞争，后者是迄今为止最先进、最成功的模型。谷歌上周声称Gemini最强大的版本“Ultra”在多项测试中表现均优于GPT-4。

今年早些时候，面对OpenAI的ChatGPT风靡全球，谷歌草草推出AI聊天机器人巴德，被员工指责称这一行动“仓促”、“拙劣”。

编辑/范辉