E25-产品:普通人应用大模型之企业AI项目从0到1

E25-产品:普通人应用大模型之企业AI项目从0到1

65分钟 ·
播放数1047
·
评论数23

每天一睁眼,朋友圈、公众号、短视频……大家最不缺的就是AI资讯了,在追更奔波之际,我也在想,作为一个AI领域从业7年的产品人,在科研视角、投资人视角之外,有什么是我们这个角色可以提供得,更大众化、更普适友好、更能融入工作的内容?

便有了这个AI主题的系列内容。

这期请到的嘉宾,是我在AI群遇到的宝藏群友,文凯。

文凯是一名数据科学家,他的经历很有趣,本科学化学,研究生学经济,还差点读了个博士,工作岗位是数据科学,现在做的是企业内的AI项目,可以说是一直在学习新领域,拓展新边界,既在享受转变过程,也有很棒的阶段性收获。

📜这次邀请他从实践者视角,给我们讲讲,如何从0开始学习和切入AI领域,如何从0到1搞定基于大模型的项目落地~我们会聊到包括但不限于以下内容:

  • 如何从数据转型到AI项目负责人

  • 如何从0开始学习AI知识领域

  • 从0到1搭建AI项目的框架和流程

  • AI项目落地中的难点与挑战

  • 企业知识库与大模型应用的关系

  • 如何评估知识库模型的效果质量

  • 企业数字化与AI结合的发展思考

与我联系:

Shownotes:

(结合喜马拉雅AI分析、通译听悟AI分析综合生成)

00:02:26 从数据科学家到AI项目负责人转型

00:05:24  国内AI项目的技术平台选择

00:12:48  企业AI项目的从0到1框架搭建

00:16:50  企业知识库建立之向量数据库

00:23:39  企业AI项目落地的质量评估与挑战

00:30:46  提示词在AI项目重要性及使用本质

00:40:06  企业AI知识库项目的发展与场景

00:51:28  企业数字化转型与AI场景结合探讨

00:55:57  企业人力分析与AI技术应用探讨

00:60:20  大模型文档总结能力的问题应对

节目简介:

人生之路,不管陷入低谷、还是站在高峰,不管走多远、走到哪,终究会走到一条自我发现、自我修炼的道路上。我是Summer,前腾讯11年产品经理,多年ToC+ToB业务和管理经验。会在这聊聊职场发展、产品成长、人生选择相关话题,不求热点、卖点,只求真诚、真心。

BGM:

《Peaceful Melody》- abcdefu

展开Show Notes
Keith_Teeth
Keith_Teeth
2023.10.09
感谢Summer老师邀请,分享了关于大模型在本地知识库的应用。其中主要使用的是检索增强生成RAG这一框架,但RAG更迭很快,大家在实践中也可以持续关注并采用更新的技术架构
Summer喵老师
:
嘉宾闪现啦~
十月Angel
十月Angel
2023.10.09
Mark 推荐上手的资料
Summer喵老师
:
我这两天也整理下,发篇小报童免费分享~
十月Angel:多谢summer 老师
Maggy豆
Maggy豆
2024.2.21
文档内容是一期关于企业AI项目搭建的播客节目,主要讨论了从0到1搭建企业AI项目的框架流程、挑战、难点以及成功经验,特别是企业知识库作为AI应用落地的成熟场景。以下是文档中提出的问题及其对应的答案:

1. **问题:数据科学家这个岗位是做什么的?**
- **答案:** 数据科学家主要分为两类,一类是算法类,负责与业务场景契合的机器学习模型,如搜索推荐系统;另一类是做AB测试或因果推断,通过统计推断解决业务增长或问题根因分析。

2. **问题:如何入门学习大模型并负责AI项目?**
- **答案:** 首先了解AI的底层技术,如阅读关键论文《Attention is all you need》了解Transformer架构。然后学习AI产品如ChatGPT的训练机制,最后通过实践积累经验,如使用B站视频和云平台(如阿里云的ModelScope)进行学习和实践。

3. **问题:在没有硬件条件的情况下,如何学习上手大模型技术?**
- **答案:** 可以利用云平台提供的资源,如阿里云的ModelScope社区,它提供了模型集合、数据集合和开源项目。阿里云还提供了基础服务框架,如Dash model(灵机)和DashVector(向量数据库)。

4. **问题:企业知识库项目为什么是企业数字化AI应用落地的成熟场景?**
- **答案:** 企业知识库项目能够满足企业内部对知识管理和信息检索的需求,通过大模型技术,可以高效地构建和维护知识库,提高员工的工作效率和知识共享。

5. **问题:在搭建企业AI项目时,如何进行数据工程和数据处理?**
- **答案:** 数据工程包括文本拆分、tokenization、去重、去隐私化等。需要将非结构化数据转换为大模型能理解的格式,如向量表示,并存储在向量数据库中。

6. **问题:如何评估AI项目的效果?**
- **答案:** 可以通过构建自己的测试集,包括从原文档中提取问题和故意引导模型产生错误回答。同时,鼓励员工在日常使用中发现问题,形成bad case跟踪,以便不断优化模型。

7. **问题:在AI项目中,提示工程的重要性如何?**
- **答案:** 提示工程对于格式化输出和理解语义非常重要,但有些问题不能仅靠提示工程解决,可能需要硬编码规则。提示工程的本质包括情境学习和思维链,即通过示例学习和逐步引导模型。

8. **问题:企业如何加快数字化进程以适应AI时代?**
- **答案:** 企业应利用现有的数字化办公工具(如钉钉、企业微信)进行数据沉淀和流程化,为AI应用打下基础。同时,企业需要完成数据中台建设,以便大模型能够进行智能分析。

9. **问题:大模型在知识文档总结能力上的表现如何?**
- **答案:** 大模型在处理知识密度高的文章时,能够比人类更好地总结知识点。可以通过关键词引导模型进行更精确的总结。

这些总结涵盖了播客中讨论的主要问题和观点,展示了企业在AI项目搭建过程中可能遇到的挑战和解决方案。
Summer喵老师
:
哪个 AI 工具?
Maggy豆:用kimi总结的
木木33
木木33
2023.10.12
我也做过类似的,难点在于没有成型的FAQ文档,很多知识都是散落在聊天对话中的,并且经常群聊转私聊,或者分布在多个对话里
Summer喵老师
:
是的,正好听网易的 AI 负责人讲,他们好像把日常沟通聊天信息也用来 AI沉淀分析了…技术上都可行,主要是机制设计
木木33:还蛮难的,我们有个部门平时比较注意文档的积累,就会比较容易。直接这么搭建了,但目前看效果有点像一个文档查询的功能。
innerpeaceai
innerpeaceai
2024.11.11
53:13 听到这个地方其实也想咨询下两位,近两年随着大模型的火热,很多大型国企央企成立一些科技创新的子公司或者研究院。(名曰为企业数字化转型赋能)。两位觉得这种子公司能做成么?或者是否靠谱呢?
Summer喵老师
:
这个问题背后要就事论事的分析太多要素了,一次咨询都不一定能说完:)直接给结论是不负责哒
innerpeaceai:嗯啊get 谢谢summer老师
innerpeaceai
innerpeaceai
2024.11.07
25:36 请问仅用测试集评估大模型效果是OK的吗?会存在过拟合问题吗?导致在生产数据中表现不稳定
Summer喵老师
:
评估大模型肯定是需要测试集的,但是仅用的话感觉还不够,关键还是每个公司和技术导向到底是什么,目标不同,选择也是多样的。过拟合跟训练数据集和测试集都有关系吧~这个问题也可以抛给gpt解答
innerpeaceai:谢谢summer老师~😘
代号 9527
代号 9527
2024.4.10
49:24 请问这里提到的chantle是什么全称啊
Summer喵老师
:
不太清楚你的英文拼写是?
代号 9527:就是这个10分钟可以做一个机器人的Ai网站
innerpeaceai
innerpeaceai
2024.11.08
35:33 发现了华点
innerpeaceai
innerpeaceai
2024.11.08
32:24 提示工程的本质
innerpeaceai
innerpeaceai
2024.11.07
16:36 大模型➕向量数据库