用AI写最好的故事 , Midreal创始人陈锴杰专访

生成式Ai的时代，内容创作与内容的消费之间的关系是什么？

人类和AI的创造力之间有什么区别？

怎样让开源模型发挥更好的效果？

嘉宾背景：MidReal 的创始人陈锴杰，持续创业者，从大学毕业后一直在创业，18 - 19 年休学创业做家庭智能机器人，，2020 年开始第二次创业做 AI agent for Gaming，目前在做 AI 互动的小说故事创作，创办了 MidReal。

MidReal 产品简介：MidReal 能让您借助人工智能创作互动式、有插图的叙述内容。从一句话开始，然后选择您自己的冒险来引导故事的无限展开。我们支持所有类型，从轶事到科幻再到奇幻。我们的平台上现在有超过 22 万的爱好者，每天创作数百个故事。

MidReal产品链接：midreal.ai

您的关注，点赞，转发是我更新最好的动力

播客内容精选

00:10为什么会选择写故事这个赛道，创办Midreal？

娱乐内容行业里面用户永远在消费最顶端的内容；如果写一个法律文书你是有一个天花板的，你写过这条线之后，你不需要把它文章变得更优美或者更连贯，他就已经可以用了，那他就结束了这个任务，所以有可能 GPT 5， GPT 6 他能做这个任务之后，你所有的训练都没有价值，但是内容就很像写代码，就你永远可以写出更高效的代码，永远可以去优化。用户今天会看漫威，但是比如说十年，可能不是五十年前看卓别林的电影。

因为我们会认为 AI 的革命其实去年 10 月大家还没有看那么清楚，但我觉得今天大家看得非常清楚，就是它是生产力的革命，前一代的互联网是信息流通效率的革命就做的是连接，再前一代工业革命做的是生产，那今天又回到了生产，用机器来生产。

那在生产的这个过程当中，我们就会去想象，如果有一个内容平台，它的生产者不再是今天的抖音博主、 b 站 up 主这样的人，而是 AI 构成一个生产者，他会是什么样的？就比如说今天的抖音，其实你也很少说见到一个博主，就这个博主他在屏幕后面究竟是人还是AI？只要他内容够好，不断在更新，跟你有互动，他可能最后就没有区别。所以我们那时候就在设想说会不会由 AI 来颠覆今天的内容平台？所以这几个因素加在一起，我们选择了这样一个赛道。

00:18问题：很多做这个领域的创业者，会选择使用 open AI 的 ChatGPT 这样最先进的模型来作为他创意的基石，你们为什么没有这么做？

那早期 OpenAI 有开放 fine Tuning 的接口的时候，我们会 fine Tuning OpenAI，但是当 LLAMA 3 它达到了 GPT4 的水平，或者年初的时候它也有 3.5 的水平的时候，我们就发现在一个开源模型上做 fine Tuning 是一个绝对更优的选择

00:21问题：什么是Post-train？

在预训练的时候，你让模型看大量的文本之后把里面的规则逐渐抽象出来，形成了它的智能，这和后训练是非常不一样的，后训练习得智能的方式很多时候是通过search、搜索或者其他的，就我们就不具体说了，就比如说 q-star 算法，或者说最近很火的这个strawberry，其实都是一种search，你不管它是什么，你可以理解为 Alphago 下棋，就是 Alphago 下一步棋的时候，你实际上要看后面的 5 步棋、 10 步棋，你看 15 步棋的时候你可以下赢李世石。那这个看后面的棋的过程，看我可能的下的空间的过程，实际上就是一个搜索的过程，你在搜索你自己有多少种可能性？那对模型来说是一样的道理。

比如说今天我们的是写故事的题，写故事的 agent 我们要搜索的就是这个情节点，接下去有多少种情节发展的可能性啊？哈利波特是要打败伏地魔？还是要和金尼结婚？还是要做什么其他的事情？它有很多可能性，我们搜索完了所有的可能性之后，找到最好的那一个，然后把故事写出来，这就是搜索的过程。所以其实后训练很多时候是在通过这样的搜索来让他获得更高的智能。

00:25问题：Post-train过程中间你们积累下来最大的信息资产是什么？

这里面其实我们会积累下我觉得三个比较重要的东西，一个是我们的pipeline，就其实一个新公司也好，或者一个大公司也好，要做到能每天训练是非常难的一件事情，这意味着你的数据能够快速地被处理，然后你的部署是稳定的，你的训练和 serving 是分开的，然后你训练完能马上做evolve，就是evaluation，能评估它的训练效果。

然后第二个就是训练过程中积累下来的，数据就数据其实是很关键的事情，这个数据可能是到最后当行业逐渐成熟之后得到的最关键的东西。因为数据虽然大家都是公开的数据，但你会发现llama 3.1 它的数据量可能就可以做到千问的十倍，就是你，你很难想象，因为阿里的人也很优秀，或者说国内很多大厂的人也都非常优秀。那我不都是从网上爬数据吗？为啥能有一个 5 倍、 10 倍的这个量级的差异呢？

然后第三个你能积累价值的东西就是你的真正的训练方法和算法，就是今天来说你怎么去搭建？你像我们的故事写作会以为它就是一个agent，但实际上我们在故事写的时候是有 4 个 agent 在跑，然后他还做不同的事情，那这四个 agent 分别负责什么？它里面每个算法又是什么？在这里我怎么保证 memory 它的记忆是能一直维持一致的？它的角色是一直一致的，它能够把故事很好地变成图片和视频。我们年底要上视频，就相当于是 AI 能写一个短剧这样的故事，这里面积累下来的算法模型的排布的架构，这些也是非常非常重要的东西。我们聊。

00:45问题：你是如何学习 AI 相关的知识的？

但是自己其实非常难学。我们交流非常多，就是跟硅谷那边的伙伴们也有很多公司，有很多朋友就在做这件事情，所以其实感觉更像是因为在做这件事情。大家交流训练的方法、数据，做的方法，哪一个模型最近最好？有什么新的东西大家是用这种角度在交流的，那比起说作为一个这个外来人在看，就有点像。我们其实都是做手机的，然后我们在交流手机我要用哪个供应商要用什么配件，但是你从一个用户的角度，然后去市场上分析这个不同手机的对比，那就两个肯定就不是同一个维度的事情，所以我们的很多学习和信息其实是从这个角度来的，而不是去读论文。就读论文也重要，但是它就今天的最好的工作都已经不是论文了，就是最重要的工作都已经不是学校在做的了，都已经是大厂在或者创业公司在做的内部工作，所以反而是和人交流可能变成今天学习最重要的事情。

00:50问题：您如何看待人类的创造力与 AI 的创造力？

人类的创造力是个性化的，而 AI 的创造力是泛化的，我的生长环境是相对地球上的七八十一人来说非常闭塞的，然后我去过的地方就那么多，但就是因为我的世界只有这么大，或者说这么小，所以我的创才会非常有特点，就是艺术家他生活环境都可能都是比较极端的。嗯，但 AI 就不一样，就为了得到 AI 的智能，然后它不能像一个人一样这样子带一个很独特的环境里成长起来，他就学习所有人类泛化的知识，那就相当于在这个过程中他把个性给平均了。所以你会看到它写出来的故事，除了故事情节上有套路，比如说人物的命名，他总是喜欢用一套人物的名字，因为他没有很独特的自己的视角，你会发现他写剧情他很爱用比喻，而且它的比喻是苍白的，就是此刻变成了永恒，我的心里像有了一个硬块，我的胃突然抽搐了一下，就是这些表述，你放在任何一个桥段里面它可能都适用。

问题：未来消费与创作之间的关系会是什么样的？

其实未来不太需要有很专门的生产者，他可以很喜欢生产这个事情。可能大部分创作以后更多是一个偏好表达的过程，它不是一个创作的过程，就今天大家是发弹和写评论来表达自己对某一个作品的想法，但在未来通过弹幕和评论你就是直接得到一个新的作品。就你说这个电视剧为啥女主要跳下悬崖？别跳啊？然后别跳，你说完了它就不跳了。然后你就看不跳的那一集，所以我觉得那时候你也不好说他们是创作者，但是他们的确是贡献了自己的偏好，贡献了自己的独特体验而产生的想法，那我觉得这些想法是有价值的，也会因为这些想法而在人类中间产生共鸣。所以我觉得，嗯，消费和生产同一化是一个方向，然后生产者直接被偏好表达给替代，我觉得也是一个方向。

往期相关内容：

AI赋能珠宝设计:基于更高的设计效率培养个人ip，实现按需定制

AI时代下的“Agent”革命与企业及个人的新机遇嘉宾：周健

S5 AI浪潮下的交互设计革新：MIX Copilot引领信息智能处理新时代

S6 AI如何改变产品经理的工作，MIXLAB NODE创始人熊叔的故事

如何通过人工智能更高效的学习：伊伊子的硅谷洞见

在这里找到我们：

* 公众号：遇见AIER Mixlab

* 收听渠道：小宇宙｜喜马拉雅

* 海外用户：Apple Podcast

* 联系我们：sidneyshe@outlook.com

如果希望加入听友群，请扫描二维码，或添加主播微信：hongyu_she