近年来,随着“第三方评论网站”的兴起,网络口碑传播的作用不断凸显,特别是在外用餐时,点评网站成为大部分人选择餐厅的主要参考。然而,近期一些网友发现,商家下面满满当当的评论,可能并非出自真人之手。
北京青年报发现,在这些共创类网站,一些网友为了“速成”,便使用ChatGpt或者类似的生成式人工智能网站,获取答案。不过,这些答案千篇一律并且毫无营养,被网友认为是“废话文学”。对于废话文学侵入的现象,一些大型的社区网站如大众点评、知乎等都出台了相应措施加以识别和声明,一批账号也因此被封禁。不过,此举也触发了一些“误判”,造成原创网友的不满。对于如何评判和区分AI生成和人工原创,各大平台仍是任重而道远。
现象:
“AI废话”充斥点评类网站
“爆米花是一种非常受欢迎的零食,它的口感酥脆,味道香甜可口”“阿迪达斯三叶草系列是阿迪达斯品牌旗下的一个经典系列”“这家餐厅位于…同时…总体来说”……你可能认为这些“正经话”只会出现在百度百科或是品牌官网,然而它们却是目前各大社区类网站当下评论区中来自“消费者”给出的答案。
北青报记者发现,在点评网站中,充斥着疑似“人工智能”编写的虚假评论。例如,一个名为“地球online**”的账号,在1月1日共发布21条评论,所点评的商家从朝阳横跨至海淀,商户种类包含餐厅、影院、蹦床馆、足疗店等。
而该账号的评论内容更是出奇一致,无论食物还是娱乐,都是在机械地介绍商品,没有分毫自己的感受和评价。像是在点评地铁站时,“地球online**”写到,“五棵松地铁站位于...... 同时该地铁站连接...... 总体来说......”。在点评快餐店时,该账号也呈现出了同样的“风格”。他写到,“炸鱼薯条是一道...... 炸鱼薯条的主要材料是...... 同时还会配以不同的酱料...... 总的来说...... ”
在该社区内,这样的账号不止一个,“地球online**”所写的点评基本适用于所有的类似商家,这样的体验无法给出该店铺的特色和真实体验,不掺杂任何感情,也无法给出参考价值,可谓“一篇废话”。而有的账号则“张冠李戴”,比如一家名为“范家大院”的烤串店下,就有名为“暴躁老**”写道,“范家大院是一家提供传统川菜的餐厅,以其地道的口味和丰富的菜品深受食客们的喜爱……”,翻阅其全部点评,如果店名中不带有菜系,就会出现大量错误。
调查:
缘何有人青睐使用AI撰写评论
那么,为什么这些用户要使用AI撰写评论呢?北青报记者在查阅点评平台活动时发现,平台每月会根据用户会员等级的差别发放价值不同的优惠券,此外如果升级成VIP,还可以无限免费抽取“霸王餐”,而升级的主要途径就是就是评论。根据大众点评官方消息,用户发布字数超过15字的评价且通过审核后,即可以获得升级经验,单日评论可获得分数没有上限;抽取霸王餐则需要用户发布超过100字评论,比前者增加了要求用户写出“优质点评”。
有消费者表示,完全依靠自己亲自探店并编写点评获得“霸王餐”等福利对绝大部分用户来说并非易事。一位今年刚达到最高等级的大众点评用户表示,在没有水一条评论的情况下,自己升级的最后一个阶段用了超过两年的时间,期间大概写了900多条评论,每周大概会评价两三次左右。她提到,级数升高后,自己中“霸王餐”的概率明显提高了,几乎“两月至少中一次”。
此外,还有的商家也会鼓励用户多些“好评”,用以刷单。
北青报记者尝试使用一款AI自动生成文案的小程序时同样注意到,用户只需在该应用程序中“店铺名称”“点评商品”和“点评要点”,在大约10秒后,就可以得到一段字数达标、结构固定的“优质点评”。
追访:
AI侵入问答拉低社区网站质量
除了美食类网站外,北青报看到,在一些问答类网站,也有不少生成式AI写的答案,它们甚至反过来又影响了AI给出的答案。
一位网友在向搜索引擎bing询问“象鼻山是否有缆车”时,bing不仅给出了肯定的答案,还就价格和淡旺季营业时间给了详细的回答。网友顺着bing提供的信息来源查找到了来自知乎的源文章,他发现这篇文章的语言逻辑过于“机械”,并且回答日期就在最近一月之内,这对于一家老牌景点来说过于异常。在点开该答主的个人主页后,他意识到这个账户大约每1-2分钟就在回答一个问题,甚至有时每一分钟都会回答两个问题。
这样的账号绝非个例,在知乎随意点进一个问题的“最新回答”后,“一眼AI”的回答几乎推挤成山。例如,在“徐州为什么可以成为淮海经济区中心城市”的问题下,已有超过一百多条以总分总的结构,论述相同内容的回答。当北青报记者点进这些回答的主页时发现,此类账号无一不是以两三分钟一篇的频率发布着“机言机语”。
如此这般,网友用生成式AI造出了虚假的答案,而一些搜索类网站的AI功能又会将这些来自“高质量社区”的答案推荐给更多网友。
这些网友的答案拉低了整个社区的质量,浪费了网友的时间和精力。有分析表示,这些虚假信息可能包含误导性的内容、错误的事实陈述甚至是完全捏造的信息,最终使得整个互联网的信任成本升高,影响公众对真实事件的认知。
热点:
AI检测反制系统时有误判
对此,国内大型社区网站也注意到了这一问题,它们也在升级系统,用以反制人工智能生成的“废话文学”。大众点评表示,VIP活动的评价审核者是基于统计学和人工智能方法,研发的“扰乱平台秩序识别“系统。
据悉,该系统可从账号的评价、交易、行为方式等多个维度对异常的数据进行排查。对于排查出的异常数据,系统会在统计学基础上依据预先设定的先验经验作出是否属于扰乱平台秩序的判定,并依据系统判定结论对用户进行处罚。而知乎对于AI的屏蔽则更具针对性。北青报记者浏览网站时发现,一些被折叠的知乎回答会标注折叠原因为“疑似AI创作”。知乎表示,创作者在发布时应声明而未主动声明的 AIGC 内容,平台将通过折叠或添加风险标识的方式,提醒读者该内容是由 AI 生成的。对于频繁发布不规范使用创作声明的 AIGC 内容、滥用 AIGC 进行违规创作的账号,平台将视违规情节严重程度,给予不同程度的账号处罚。对于检测系统,知乎称,审查基于知乎自研的知海图大模型,平台现已实现了线上实时检测,AIGC 内容在发布后可被及时识别和前台标记。
然而,北青报记者调查发现, 反制系统“道”高一尺,AI进化速度“魔”高一丈,对于如何评判和区分AI生成和人工写手,各大平台仍是任重而道远。一方面,即便平台声称已上线有效的AI检测系统,但可见的是,仍有不少“漏网之鱼”流窜在评论区间。另一方面,也有部分网友称,网站的模型总是误判自己的回答内容,“误判率太高了,认认真真写的回答很容易被当成包含AI创作内容”“实际上GPT的生成内容本来就是来自人类的语料,单凭格式去判断其实并不太好”“这种检测最终坑的只是人类写手而已”。有网友分析,“网站的检测模型现在还并不准确,有待优化。人工写的,但只要内容条理化一些,分了点,尤其用总分总这类结构,就很容易被判AI创作,而且自动处罚。”
关注:
AI规范使用政策正在陆续出台
北青报记者看到,针对人工智能所引发的争论,国家也在不断出台相关规范AI使用的政策。2023年4月11日,国家互联网信息办公室正式发布《生成式人工智能服务管理办法(征求意见稿)》,其中拟规定,利用生成式人工智能生成的内容应当真实准确,采取措施防止生成虚假信息。2023年7月10日,国家互联网信息办公室等部门公布《生成式人工智能服务管理暂行办法》。《办法》指出,应鼓励生成积极健康、向上向善的优质内容,要求不得生成法律、行政法规禁止的内容,并要求对图片、视频等生成内容进行标识。
相比4月发布的《生成式人工智能服务管理办法(征求意见稿)》,新出台的《生成式人工智能服务管理暂行办法》在多处放宽了监管要求,并增加了鼓励人工智能技术发展的措施。例如,相比起《征求意见稿》中要求AI生成的内容不得包含“虚假信息”,《办法》则限定为“虚假有害信息”,相当于放宽了对AI生成内容的限定。另外,《征求意见稿》还要求提供生成式人工智能服务方单方面“采取措施以防止生成虚假信息”,这一条没有出现在《办法》中。
多位业内人士在接受北青报记者采访时强调,人工智能并非“洪水猛兽”,重点在于如何规范对它的使用。有分析称,人工智能的快速进步给社会发展带来诸多机遇,但其被恶意使用的风险也逐渐显现。技术本身无善恶之分,但当技术越来越先进时,越应当引领其发展方向。
案例:
男子用AI生成“假新闻”被判5年
北青报记者看到,此前已有网友因为滥用ChatGPT生成假新闻,而造成社会恐慌。2023年4月起,多篇有关不同地区“火车事故”的相似报道同时出现在网络中,警察调查后发现,这些假新闻皆是来自一名广东的洪姓男子。该犯罪嫌疑人在全网搜索近几年社会热点新闻,并通过ChatGPT软件将搜集到的新闻要素修改编辑后,上传至其购买的账号上非法获利。
警方表示,洪姓男子编造假新闻并散布在网络上供人大量浏览的行为,已涉嫌寻衅滋事罪,因此对其采取刑事强制措施,最高可判处五年有期徒刑。
实际上,并非只有国内因为这类利用ChatGPT生成假消息而困扰,如何应对AI制造出的假信息已经成为了一项全球性问题。美国企业亚马逊、推特等平台也没有从AI文案中幸免,二者皆在软件内发现了由ChatGPT驱动产生的虚假评论和推文。亚马逊客户信任团队负责人达哈梅什·梅塔此前表示:“我们使用机器学习来寻找可疑账户,跟踪留下评论的购买账户与销售该产品的人之间的关系。通过将机器学习和人工智能相结合,我们将能够在客户看到之前阻止虚假评论。”
【版权声明】本文著作权(含信息网络传播权)归属北京青年报社所有,未经授权不得转载
实习记者 肖雨涵
文/北京青年报记者 温婧
编辑/樊宏伟