在过去半年的AI浪潮中,一个22岁的小伙子凭借“反其道而行”的敏锐嗅觉,凭借能够分辨AI文本的GPTZero一炮而红。现在他有了更大的梦想:联合媒体行业大佬打造一款识别“假新闻”的工具。
来源:GPTZero
作为一名在普林斯顿大学主修计算机科学,辅修新闻学的大四学生,Edward Tian在今年元旦假期里写出了GPTZero程序。一经上线便火爆全球,至今已经拥有数百万用户。
注:来自他的个人推特
GPTZero本身是基于OpenAI的GPT模型微调而来,判断文本是否为AI撰写的逻辑主要有两条:困惑度和突发性。简而言之,如果机器人对给予的文本更加熟悉,那么这段文本更有可能是由AI生成的。根据官网介绍,这个模型对于人类撰写文本的识别准确率高达99%,对AI文本的识别准确率也能达到85%。
根据财联社编辑的简单测试,这款应用目前能够正确识别出GPT-3.5撰写的文本,但对更聪明的GPT-4识别成功率明显下降。
来源:ChatGPT、GPTZero
凭借GPTZero打响知名度,Edward Tian目前已经拉起一个10人小团队,并拿到350万美元的风险投资。投资人中就包括Stability AI的创始人兼CEO伊马德·莫斯塔克,现在市场上许多“图像生成大模型”都与他们家的Stable Diffusion有关,近期Stability AI也发布了开源大语言模型。
在取得最初的成功后,Edward Tian的下一步动作正是将AI技术与自己的新闻理想结合起来。目前,他们的小团队启动了一个名为“Origin——拯救新闻行业”的项目,主要的目的是使用AI识别通过AI生成的假新闻。
作为最新的进展,本周一Edward Tian的团队向汤姆· 格洛瑟(前汤森路透和路透社CEO)和马克·汤普森(曾担任BBC总编辑、纽约时报总裁兼CEO)等业界巨头展示了Origin第一个样本。据报道,双方讨论了AI检测和分析领域的合作。Edward Tian的公司也有志于开拓信任&安全产业、政府、版权、金融、法律等领域的业务。
来源:社交媒体
OpenAI也是跟随者
在Edward Tian的GPTZero爆火后,OpenAI也推出了自营的检测工具AI Text Classifier,但至今仍处于不太好用的状态。根据报道,OpenAI这款官方应用在识别AI文本时只有26%的准确率,同时也有9%的概率把人类撰写的文章错判成AI。此外这款应用在识别英语以外的文本时表现更糟,检测短文本和代码时的结果更是“不可靠”。
来源:OpenAI
更关键的是,OpenAI明确表示检测的结果不能用于下判断,只能作为决定文本来源的辅助应用。这也意味着,即便大学教授检测出学生论文由AI生成的概率达到70%,他也无法因此就使用惩戒手段。
而对于AI检测行业来说,目前也有两个最主要的困难。首先,由于AI生成文本的社会危害性并不如恶意制作的图片、视频那么明显,所以潜在付费客户对于这项业务的兴趣并没有那么大。此外,目前用于检测AI的技术也不成熟。专注AI产业投资的Tola Capital董事总经理Sheila Gulati介绍称,目前的检测工具大都是一些过渡性的产品,这个行业的最终形态的复杂程度可能会比现在高出很多。
编辑/范辉