RAGFLOW,为DEEPSEEK这样的思考模型插上知识库的翅膀—对话RAGFLOW 创始人张颖峰

RAGFLOW,为DEEPSEEK这样的思考模型插上知识库的翅膀—对话RAGFLOW 创始人张颖峰

55分钟 ·
播放数791
·
评论数6

当大模型不再“死记硬背”,知识库如何成为推理引擎的“外挂大脑”?

“大模型能回答问题,但答案像从课本上抄来的。”

“企业有海量数据,但AI一问三不知。”

这些开发者与企业的共同痛点,正在被RAG(检索增强生成)破解。而初创公司InfiniFlow凭借开源项目RAGFLOW,以3.9万GitHub星标和1万+国内外开发者用户的成绩,成为这场技术革命的领跑者。

在长达一小时的深度访谈中,InfiniFlow创始人张颖峰反复强调:“RAG不是大模型的补丁,而是下一代搜索引擎。”这场对话不仅揭示了RAG技术的底层逻辑,更展现了一个野心:

让DEEPSEEK真正学会“思考时检索”可能是通往AGI之路的一条捷径。当AI学会“思考时检索”时,更多高价值场景的大门将被打开。

以下是部分访谈中的核心观点

一、RAGFLOW的“硬核武器”:

从数据入口到搜索内核的全链路优化

1. 重型文档解析:数据质量的“第一道防线”RAGFLOW的破局点在于“Quality In”策略:

* 50+格式支持:PDF、PPT、Excel、扫描件及图文混排文件均可解析;

* 多模态处理能力:分析表格、图表与文本的关联性,避免信息割裂;

* 分级知识库:按文档重要性自动分级存储,提升关键信息召回效率。

2. 搜索引擎的“反共识选择”:

为什么是Elasticsearch?当行业追捧向量数据库时,RAGFLOW坚持采用“老牌”搜索引擎Elasticsearch(ES)。可靠的检索不能仅依赖向量引擎——传统关键词匹配结合语义搜索,能在极端场景下保障检索结果的下限。“向量搜索像‘开盲盒’,而企业需要确定性。ES的检索能力是RAG的刚需。”

3. 语义鸿沟的“三重补丁”

RAG的核心难点在于用户问题与答案间的语义断层。RAGFLOW在传统向量RAG系统上新增三套方案:

  • Graph RAG:构建轻量级知识图谱,解决“猪八戒与白龙马关系”类复杂问题;
  • 标签库系统:人工定义高频术语标签(如“iPhone=手机”而非“手机壳”),提升排序权重;
  • 工作流系统:通过结构化指令,将模糊问题(如“公司营收增长原因”)改写为精准检索逻辑。


二、推理时代的“杀手级场景”:从知识库到决策引擎的跃迁

当前落地场景:90%的需求仍是基础问答

  • 知识库问答:企业内部文档的快速查询;
  • 客服系统:基于工单库的自动化问题回复;
  • 文档助手:合同、论文的摘要生成与关键信息提取。

张颖峰认为:“这只是RAG的冰山一角。推理能力的爆发将解锁高阶场景,而‘边推理边搜索’可能是打开这些场景的关键钥匙。”。

未来RAG可能和推理模型共同组合成“大记忆模型”,大记忆模型将拥有下面的能力——

  • 动态记忆管理:短期对话记忆与长期知识库无缝衔接;
  • 注意力机制外延:模型像人类“选择性调用记忆”;
  • 将数据与模型的Attention计算结果深度绑定;
  • 高频知识的KV Cache直接存储于数据库;
  • 中低频率知识图谱化。“大记忆模型可降低多Agent系统的运算成本,无需训练即可快速调用企业数据资产,提供精准,低成本,高效的AI服务。”
  • 多Agent协同:法务、财务、研发Agent共享知识库,协作生成方案。

“未来的企业AI,会像人一样拥有‘工作记忆’

随着大记忆模型的成型,AI会逐渐从“效率工具”,进化为组织的“数字员工”,直接实现下列场景:

  • 多Agent协同生成带风险提示的企业审计报告;
  • 基于设备数据,和过往案例的设备风险监测,和解决方案建议

三、给AI应用开发者的建议

RAG技术基于传统技术,虽不神秘,但需关注AI相关的各个技术领域,如自然语言处理、机器学习、计算机视觉等。应用开发者不应将RAG视为黑盒,需深入理解检索、解析等环节,以优化工具使用并排查问题

结语:在DEEPSEEK这样的推理模型时代,没有“人”是一座孤岛。真正的智能不在于模型本身有多大,而在于你需要的时候,能否调取所需的数据,给你需要的回答。

在这场数据与推理的“双向奔赴”中,企业可以通过RAGFLOW为自己的“AI大脑”装配最适配的“外部数据库”。

往期相关内容:

"不如主动拥抱AI" - 一位阿里设计老将转型AI产品的实战指南MoPaaS: 让AI应用落地不再难 - 企业的"智能化加速器"

一周时间,编程新手能够用Ai写出怎样的工具?Mixlab Ai编程挑战赛 一周时间,编程新手能够用Ai写出怎样的工具?

用AI写最好的故事 , Midreal创始人陈锴杰专访AI时代下的“Agent”革命与企业及个人的新机遇

AI赋能珠宝设计:基于更高的设计效率培养个人ip,实现按需定制

S5 AI浪潮下的交互设计革新:MIX Copilot引领信息智能处理新时代

S6 AI如何改变产品经理的工作,MIXLAB NODE创始人熊叔的故事

如何通过人工智能更高效的学习:伊伊子的硅谷洞见

在这里找到我们:

* 公众号:遇见AIER Mixlab

* 收听渠道:小宇宙|喜马拉雅

* 海外用户:Apple Podcast

* 联系我们:sidneyshe@outlook.com

如果希望加入听友群,请扫描二维码,或添加主理人微信:hongyu_she

展开Show Notes
Savita
Savita
2025.2.25
跟腾讯云的知识库有什么区别吗?
洪宇S
:
在你自己手上,另外他集成的功能包括数据预处理,腾讯云预处理的手段是有限的
Savita:谢谢
3条回复
Savita
Savita
2025.2.25
怎么进RAGFLOW社区?
ProjectAlice
ProjectAlice
2025.2.25
推理时检索