北京青年报

靠识别AI一炮而红 GPTZero又在整新活：联合传媒大佬识别假新闻

财联社 2023-05-10 16:36

在过去半年的AI浪潮中，一个22岁的小伙子凭借“反其道而行”的敏锐嗅觉，凭借能够分辨AI文本的GPTZero一炮而红。现在他有了更大的梦想：联合媒体行业大佬打造一款识别“假新闻”的工具。

来源：GPTZero

作为一名在普林斯顿大学主修计算机科学，辅修新闻学的大四学生，Edward Tian在今年元旦假期里写出了GPTZero程序。一经上线便火爆全球，至今已经拥有数百万用户。

注：来自他的个人推特

GPTZero本身是基于OpenAI的GPT模型微调而来，判断文本是否为AI撰写的逻辑主要有两条：困惑度和突发性。简而言之，如果机器人对给予的文本更加熟悉，那么这段文本更有可能是由AI生成的。根据官网介绍，这个模型对于人类撰写文本的识别准确率高达99%，对AI文本的识别准确率也能达到85%。

根据财联社编辑的简单测试，这款应用目前能够正确识别出GPT-3.5撰写的文本，但对更聪明的GPT-4识别成功率明显下降。

来源：ChatGPT、GPTZero

凭借GPTZero打响知名度，Edward Tian目前已经拉起一个10人小团队，并拿到350万美元的风险投资。投资人中就包括Stability AI的创始人兼CEO伊马德·莫斯塔克，现在市场上许多“图像生成大模型”都与他们家的Stable Diffusion有关，近期Stability AI也发布了开源大语言模型。

在取得最初的成功后，Edward Tian的下一步动作正是将AI技术与自己的新闻理想结合起来。目前，他们的小团队启动了一个名为“Origin——拯救新闻行业”的项目，主要的目的是使用AI识别通过AI生成的假新闻。

作为最新的进展，本周一Edward Tian的团队向汤姆· 格洛瑟（前汤森路透和路透社CEO）和马克·汤普森（曾担任BBC总编辑、纽约时报总裁兼CEO）等业界巨头展示了Origin第一个样本。据报道，双方讨论了AI检测和分析领域的合作。Edward Tian的公司也有志于开拓信任&安全产业、政府、版权、金融、法律等领域的业务。

来源：社交媒体

OpenAI也是跟随者

在Edward Tian的GPTZero爆火后，OpenAI也推出了自营的检测工具AI Text Classifier，但至今仍处于不太好用的状态。根据报道，OpenAI这款官方应用在识别AI文本时只有26%的准确率，同时也有9%的概率把人类撰写的文章错判成AI。此外这款应用在识别英语以外的文本时表现更糟，检测短文本和代码时的结果更是“不可靠”。

来源：OpenAI

更关键的是，OpenAI明确表示检测的结果不能用于下判断，只能作为决定文本来源的辅助应用。这也意味着，即便大学教授检测出学生论文由AI生成的概率达到70%，他也无法因此就使用惩戒手段。

而对于AI检测行业来说，目前也有两个最主要的困难。首先，由于AI生成文本的社会危害性并不如恶意制作的图片、视频那么明显，所以潜在付费客户对于这项业务的兴趣并没有那么大。此外，目前用于检测AI的技术也不成熟。专注AI产业投资的Tola Capital董事总经理Sheila Gulati介绍称，目前的检测工具大都是一些过渡性的产品，这个行业的最终形态的复杂程度可能会比现在高出很多。

编辑/范辉