北京青年报

轮到谷歌了！被控秘密窃取数亿美国人的数据训练人工智能

财联社 2023-07-13 10:36

毫不意外，谷歌也要面临侵权诉讼了。一家律师事务所指控这家科技巨头未经用户同意，秘密窃取了数亿美国用户的数据，以训练和开发其人工智能(AI)产品。

当地时间周二，克拉克森律师事务在美国加州法院提起集体诉讼，指控谷歌、其母公司Alphabet和其人工智能子公司DeepMind在用户不知情或不同意的情况下获取用户数据。

该律所上个月曾对ChatGPT开发商OpenAI提起类似诉讼。近日，美国多个作家也起诉OpenAI违法使用其作品训练ChatGPT。

人工智能聊天机器人是在大量的文本数据上进行训练的，OpenAI没有透露训练ChatGPT具体使用了哪些数据，但该公司表示，它通常会抓取网络数据，包括使用档案图书和维基百科等。

起诉书中指出，谷歌一直在秘密窃取数以亿计的美国人在互联网上创造和分享的一切内容，谷歌拿走了我们所有的个人和专业信息、我们的创意和文案作品、我们的照片，甚至我们的电子邮件，几乎是我们所有的数字足迹，以构建其人工智能产品。

起诉书还提到，多年来，谷歌一直秘密收集这些数据，但却没有通知任何人，也没有得到任何人的同意。起诉还引用了谷歌从7月1日起更新的隐私政策，明确指出该公司可能使用公开可访问的信息来训练其人工智能模型和工具，如Bard、谷歌翻译等。

克拉克森律师事务所表示，谷歌必须明白：它不拥有互联网，它不拥有我们的创造性作品，它不拥有我们的人格表达，我们的家人和孩子的照片，或其他任何东西。‘公开可用’从来不意味着可以免费使用用户内容，并用于其他任何目的。

该诉讼寻求暂时冻结谷歌生成式人工智能工具的商业访问和商业开发，并要求对数据被盗用的用户进行经济赔偿，但具体数额不详。

不过谷歌法律顾问Halimah DeLaine Prado表示，该公司多年来一直很清楚，它使用来自公共来源的数据，比如发布到开放网络和公共数据集的数据，来训练谷歌翻译等工具，此次更新只是明确了新服务如Bard也包含在内。

Prado告诉媒体，美国法律支持利用公共信息创造新的有益用途，我们期待反驳这些毫无根据的说法。

上个月，谷歌、OpenAI等人工智能公司与出版商就新闻内容版权问题进行了会谈，这些公司可能会达成相关协议。通过这些协议，出版商的内容将用来帮助训练人工智能系统，而出版商将获得订阅费，不过谈判仍处于早期阶段。

编辑/范辉