AI与人类语料的真假之辨一场没有硝烟的战争

今天咱们聊一个特别有意思的话题AI和人类语料之间的真假之辨。这事儿说起来还挺玄乎的，就像是一场没有硝烟的战争，悄无声息地在我们身边上演。

最近我收到了一篇稿子，短短两千字，却出现了三个有人认为，外加三个有网友认为。这让我和编辑部的同事们不禁怀疑这到底是人写的，还是AI写的？给AI断文风，听起来是件很荒谬的事，但现实就是这么魔幻。

随着AI生成的内容越来越多，人类逐渐意识到，自己无法准确判断眼前的文字来自一双手还是一串代码。编辑在邮箱里收到文学作品投稿，会怀疑它是否由AI创作读者在网络读到新闻报道，会怀疑它是否由AI采写用户在社交平台刷到一篇帖子，会怀疑它是否由AI批量生产用来起号。就连打开外卖软件的客人，都需要怀疑那些辞藻华丽但充满食缩力的好评，是否由AI生成，以掩盖预制菜的乏味。

人类的文字内容，正在进入特殊的怀疑主义时代。尽管此前的每一次大众媒介变革中，我们都曾浸泡在或多或少的怀疑氛围里，但AI的高效，正让硅基语料的传播度指数级增长，并让怀疑的情绪线性增长。

为了探测AI编造能力的边界，我们决定进行一场单方面测试。五位参赛选手分别是豆包Kimik15DeepseekR1文心一言40工具版和GPT o3mini。我们让它们模仿鲁迅的风格，结果发现，AI在模仿作家风格时，总是会露出马脚。比如文心一言生成的文本颇具穿越感，GPT o3mini则几乎每一段都要cue一下鲁迅的三件套麻木讽刺苦闷。Kimi和DeepSeek的思考过程更复杂，但在实践过程中，Kimi产出了10段几乎句式完全相同的文本，DeepSeek则在意象的堆砌中秀了一把词汇拼贴能力。

在已知AI生成文本的前提下，我们总能找出每位AI选手模仿作家时的蹩脚之处。但如果把真假作家的文本打乱混杂在一起，人类读者能火眼金睛地识别出碳基和硅基创作者的差别吗？我们特邀了两位测试嘉宾，结果发现，当前AI模仿作家风格生成的新文本，完全不能骗过这些作家的读者。

尽管论文小说报告新闻等领域的AI写作更容易引起广泛讨论，但事实上，这些由职业人类写作者完成的文本内容，对当前的硅基写手，还存在很高的模仿难度。相较之下，充斥互联网的日常语料，才是AI文本真正的重灾区。批量生产的八卦新闻和家庭故事正在围攻社交平台，新闻短视频图文内容的评论区也充斥着AI生成的假人假话。

这已经不再只是AI幻觉的问题了。当人类的日常语料被无限稀释，当我们刷着用AI刚编的婆媳关系帖，给新闻评论区的AI评论点上一个赞，又收到一条AI留言提醒，也许人类才是一种幻觉。而我们总不能每次都搬出鲁迅沈从文张爱玲这样的名字，就像达摩祖师不可能从第一章打到最后一章。

编造不是AI带来的，对AI稀释人类语料的担忧也不意味着一种反AI的立场。观察人类语料被AI稀释的过程，让我不断回到现代性与大屠杀的阅读记忆里。倘若不加以修正，人类语料所要经受的大屠杀，或许也将成为AI时代的固有可能。

好了，今天的话题就聊到这里。我是敢想老田，咱们下期再见！