AI与人类语料的真假之辨一场没有硝烟的战争敢想科技说

AI与人类语料的真假之辨一场没有硝烟的战争

4分钟 ·
播放数0
·
评论数0

今天咱们聊一个特别有意思的话题AI和人类语料之间的真假之辨。这事儿说起来还挺玄乎的,就像是一场没有硝烟的战争,悄无声息地在我们身边上演。

最近我收到了一篇稿子,短短两千字,却出现了三个有人认为,外加三个有网友认为。这让我和编辑部的同事们不禁怀疑这到底是人写的,还是AI写的?给AI断文风,听起来是件很荒谬的事,但现实就是这么魔幻。

随着AI生成的内容越来越多,人类逐渐意识到,自己无法准确判断眼前的文字来自一双手还是一串代码。编辑在邮箱里收到文学作品投稿,会怀疑它是否由AI创作读者在网络读到新闻报道,会怀疑它是否由AI采写用户在社交平台刷到一篇帖子,会怀疑它是否由AI批量生产用来起号。就连打开外卖软件的客人,都需要怀疑那些辞藻华丽但充满食缩力的好评,是否由AI生成,以掩盖预制菜的乏味。

人类的文字内容,正在进入特殊的怀疑主义时代。尽管此前的每一次大众媒介变革中,我们都曾浸泡在或多或少的怀疑氛围里,但AI的高效,正让硅基语料的传播度指数级增长,并让怀疑的情绪线性增长。

为了探测AI编造能力的边界,我们决定进行一场单方面测试。五位参赛选手分别是豆包Kimik15DeepseekR1文心一言40工具版和GPT o3mini。我们让它们模仿鲁迅的风格,结果发现,AI在模仿作家风格时,总是会露出马脚。比如文心一言生成的文本颇具穿越感,GPT o3mini则几乎每一段都要cue一下鲁迅的三件套麻木讽刺苦闷。Kimi和DeepSeek的思考过程更复杂,但在实践过程中,Kimi产出了10段几乎句式完全相同的文本,DeepSeek则在意象的堆砌中秀了一把词汇拼贴能力。

在已知AI生成文本的前提下,我们总能找出每位AI选手模仿作家时的蹩脚之处。但如果把真假作家的文本打乱混杂在一起,人类读者能火眼金睛地识别出碳基和硅基创作者的差别吗?我们特邀了两位测试嘉宾,结果发现,当前AI模仿作家风格生成的新文本,完全不能骗过这些作家的读者。

尽管论文小说报告新闻等领域的AI写作更容易引起广泛讨论,但事实上,这些由职业人类写作者完成的文本内容,对当前的硅基写手,还存在很高的模仿难度。相较之下,充斥互联网的日常语料,才是AI文本真正的重灾区。批量生产的八卦新闻和家庭故事正在围攻社交平台,新闻短视频图文内容的评论区也充斥着AI生成的假人假话。

这已经不再只是AI幻觉的问题了。当人类的日常语料被无限稀释,当我们刷着用AI刚编的婆媳关系帖,给新闻评论区的AI评论点上一个赞,又收到一条AI留言提醒,也许人类才是一种幻觉。而我们总不能每次都搬出鲁迅沈从文张爱玲这样的名字,就像达摩祖师不可能从第一章打到最后一章。

编造不是AI带来的,对AI稀释人类语料的担忧也不意味着一种反AI的立场。观察人类语料被AI稀释的过程,让我不断回到现代性与大屠杀的阅读记忆里。倘若不加以修正,人类语料所要经受的大屠杀,或许也将成为AI时代的固有可能。

好了,今天的话题就聊到这里。我是敢想老田,咱们下期再见!