大家好,欢迎来到共识粉碎机AI颠覆软件讨论会系列的第一期播客!
共识粉碎机是AI圈的老社群了,从去年3月份开始我们就坚持举办AI颠覆软件讨论会系列,走到现在已经是第19期了,我们也终于准备好在第19期将内容搬上播客!
与过去大家听到的AI播客不同,我们同时会讨论场景、应用,也会直接进入到技术细节。
讨论节奏会非常快速,信息量非常密集,相信每一期对于听众都是一次信息大爆炸。
【本期嘉宾】
陈将:Ziilliz生态和AI平台负责人
唐飞虎:月之暗面担任研发工程师和开发者关系负责人
【共识粉碎机主持人】
周默:共识粉碎机公众号主理人,前美元对冲基金投资人,前腾讯/微软战略与投资经理。
共识粉碎机目前也承接投研咨询合作与AI战略转型/大模型技术落地项目,欢迎戳公众号了解。
【参考资料】
本期的内容已经抽取成文字纪要,请查阅共识粉碎机公众号的文章:
关于RAG的讨论共识粉碎机在过往文章中也有讨论,请查阅:
【本期内容】
本次讨论的大背景是在之前的RAG讨论会后(陈将老师也作为嘉宾参与),我们收到了非常多关于在不同场景是选择长文本还是RAG的问题。与过去讨论长文本与RAG经常空对空相比,我们本次讨论会将分到具体的场景、具体的指标,方便创业者、从业者、投资人具体了解。
以下是我们聊得:
00:04:21 长文本与RAG的典型差别:准确率
00:06:55 长文本与RAG的典型差别:成本与延迟
00:09:43 长文本降低First Token延迟的方法
00:13:40 长文本vsRAG就像关公战秦琼,:要看场景
00:16:35 RAG的部署工作与难度
00:20:38 RAG的权限处理
00:23:58 长文本的部署与权限处理
00:27:25 长文本的技术爬坡路径
00:29:16 RAG的技术爬坡路径
00:35:04 场景比较:数值计算/Text2SQL
00:40:24 场景比较:客服与Sales Agent
00:52:10 长文本与RAG的长度边界讨论
00:55:01 场景比较:AI Coding
01:01:04 企业的代码库有多大?
01:03:49 企业大代码库一定要用RAG吗?
01:05:36 企业大代码库如何做解析结构?
01:09:02 场景比较:AI搜索
01:11:24 GitHub Copilot用长文本还是RAG?
01:12:26 RAG的成本原理与组成
01:17:17 长文本还有哪些工作可以降低成本?
01:18:53 长文本与RAG的融合架构与部署
01:23:36 QA环节:长文本的技术壁垒与大模型差异化
01:24:52 QA环节:AI搜索他对于网页语义提取能做到什么颗粒度?AI搜索是否还会混合过去的传统倒排?
01:28:12 QA环节:大厂的丰富索引库经验会不会让其在AI搜索上比创业公司更强?
01:29:46 QA环节:GraphRAG带给我们什么启发?技术路线是否是现在的Best Practice?
01:34:15 QA环节:企业内部落地RAG的过程中如何克服冷启动?