北京青年报

大模型扎堆参加高考作文，百度、讯飞、ChatGPT哪家强？

第一财经 2023-06-07 20:05

6月7日，2023年高考正式开考。伴随考试的进行，2023年高考作文题陆续公布。相较于往年网友热议，今年新加了一批场外参与者——人工智能大模型企业。

记者通过尝试发现，包括ChatGPT、百度文心一言、讯飞星火、360智脑等大模型平台均能够顺利对作文试题进行作答，且伴随体验人数的增多，大模型每次给出的作文答卷也发生升级变化。但同时，大模型作文刻板化的问题也较为突出。

例如全国甲卷“人·技术·时间”的试题，题面为“人们因技术发展得以更好地掌控时间，但也有人因此成了时间的仆人。这句话引发了你怎样的联想与思考？请写一篇文章。要求选准角度，确定立意，明确文体，自拟标题；不要套作，不得抄袭；不得泄露个人信息；不少于800字。”

最初尝试时，ChatGPT似乎还无法理解作文格式，将题目要求的几个重点分开回答。但经过训练之后，已经能够给出完整的作文篇章。

ChatGPT写道：我们不可避免地发现，有些人似乎陷入了时间的奴役，变成了时间的仆人。他们追求技术的便利和刺激，却失去了对时间的控制。我们不能简单地将技术本身归咎为时间的主人还是仆人，关键在于我们如何使用和对待技术。我们需要发展一种科技与时间的良好关系。科技应该成为我们的助手，而不是主宰我们的生活。因此，我们需要审视自己与科技的关系，反思自己对时间的使用方式。

除了ChatGPT，另外几家大模型平台在高考作文中也表现出了较为稳定的“语言”理解能力。

文心一言测试结果

文心一言写道：我们应该在科技的浪潮中保持警觉，让时间成为我们的朋友，而非仆人。技术的进步使我们的生活节奏加快，使我们在追求效率的同时，丧失了享受生活的时间。为了更好地掌控时间，我们应当回归生活的本质，从内心寻找力量。应当培养一颗从容淡定的心。以一颗从容淡定的心去面对这个快节奏的世界。

讯飞星火测试结果

讯飞星火写道：手机、电脑等现代科技产品让我们可以随时随地地获取信息和完成任务，但也让我们沉迷于虚拟世界，忽略了现实生活。然而，时间并不是我们的奴隶，我们才是它的主人。有些人因为工作繁忙而失去了生活的乐趣，他们整天忙碌于工作之中。还有一些人因为沉迷于游戏、社交媒体等虚拟世界而失去了现实生活的意义。我们需要意识到，时间是我们最宝贵的财富，我们需要珍惜它。

可以看出，大模型写出的作文文本具有逻辑性，但也有一定语病存在。

360智脑测试结果

360智脑写道：随着科技的不断发展和进步,人类的时间观念也在不断地发生着变化。首先，我们需要认识到时间是宝贵的资源。其次,我们应该重视时间管理技能的培养。最后,我们也要警惕成为时间的“仆人”。虽然现代科技的发展为我们的生活带来了很多便利,但同时也给我们带来了一定的负面影响。例如,很多人因为沉迷于手机等电子产品而忘记了自己的时间和任务,最终成为了时间的“仆人”。

可以看出，360智能在逻辑关系上混淆了时间与科技。

综合上述各家大模型平台对该篇作文的论述，可以看出只有ChatGPT完整充分地切题，对科技与时间的关系进行探讨。而其他家在表述过程中逐渐偏题，一味讨论如何把握人与时间的关系，做时间的主人，而忽视科技在本题中的重要性。

对于冲上热搜的“AI写高考作文”话题，网友表达了各自的观点，既有认为AI写作非常厉害、属于中上水平的观点，也有认为大模型作文刻板化，由于缺乏现实案例而空洞的建议。

针对此次大模型平台对高考作文的评测，AGI-AIGC-GPT评测DIKWP实验室的负责人，工学博士、海南大学三级教授段玉聪对记者表示，GPT-4的回答在认知距离方面展现了以下特点：GPT-4回答时会对问题背后的背景数据进行铺垫，确保回答的完整性和准确性。这意味着它具备对问题所涉及领域的广泛知识，并能从中提取相关信息进行回答。GPT-4能够分析问题中的概念和含义，并提供深入的解析。它不仅仅回答问题，还能够解释概念的背后含义，帮助提问者更好地理解和应用相关概念。GPT-4回答问题时能够突出问题的主题意图，确保回答与问题的关键点一致。它能够识别问题中的关键词和主题，并围绕这些要素提供相关的回答和信息。

相比之下，段玉聪认为讯飞星火和文心一言在认知距离方面存在一些限制和不足。一方面，过多侧重数据层面的直接带入：讯飞星火和文心一言在回答中过多地依赖直接带入数据，缺乏对数据的深度分析和综合。这可能导致回答的局限性和缺乏整体性。

其次，对作文交互信息形式的结构套用：讯飞星火和文心一言在回答中可能过于套用作文交互信息的结构，导致回答的过渡不自然和主题意图的分离。这可能使得回答的连贯性和完整性受到影响。以及，主题意图的分离和过渡不自然：讯飞星火和文心一言在回答中可能没有很好地突出主题意图，导致回答与问题的关键点不够一致。同时，它们在不同段落或句子之间的过渡可能显得不够自然和流畅。

综上所述，段玉聪认为GPT-4在认知距离方面相比讯飞星火和文心一言表现更好，通过背景数据层面的铺垫、概念含义信息的解析、主题意图的突出、知识层面的提升以及价值观的智慧引导，能够提供更全面、深入和符合用户期望的回答。

但需注意的是，不论是问答对话还是作文演练，大模型平台面向C端的产品更多属于企业技术层面的展示，目前行业更多期待大模型技术在具体场景的应用落地。国信证券研报认为，AIGC持续看好大模型、IP数据要素等底层要素，场景落地持续看好AI+文学、音乐、数字人、营销服务、电商、视频、游戏等领域。

编辑/樊宏伟