E24-产品:普通人学习大模型之向AI算法工程师学习

E24-产品:普通人学习大模型之向AI算法工程师学习

61分钟 ·
播放数761
·
评论数15

每天一睁眼,朋友圈、公众号、短视频……大家最不缺的就是AI资讯了,在追更奔波之际,我也在想,作为一个AI领域从业7年的产品人,在科研视角、投资人视角之外,有什么是我们这个角色可以提供得,更大众化、更普适友好、更能融入工作的内容?

便有了这个AI主题的系列内容。

这期请到的嘉宾,是我的朋友+合作过的靠谱战友超哥。

超哥有近十五年自然语言处理研发经验,曾在大厂和AI独角兽负责过语义理解、深度问答、开放域聊天、情感分析等工作,在ACL、EMNLP等会议上发过多篇论文,手上专利一把,是妥妥的AI领域的专精人才了。

这次邀请他从专业视角,给我们做一些AI研发流程的科普介绍,谈谈这大模型的浪潮对算法工作带来哪些影响,非技术从业者如何上手学习,以及AI产品人如何找到自己的定位等等~

📜我们会聊到,包括但不限于以下内容:

● AI技术研发流程介绍

● AI大模型出现对算法工作影响

● AI大模型对工作的要求和挑战

● 怎么评价AI模型的好坏

● 拉开AI大模型差距的原因

● 非AI算法从业者,如何学习大模型

● AI产品经理的价值探讨

● AI产品经理的合作建议

与我联系:

Shownotes:

(结合喜马拉雅AI分析、通译听悟AI分析综合生成)

00:06:51  大模型对AI工作的影响

00:14:21  AI算法工程师的价值体现

00:17:22  大模型的长度与宽度

00:22:08  数据在AI中的重要性

00:30:10  数据工程对模型影响

00:34:50  国内大模型的技术现象

00:39:51  强化学习的跟进难度

00:47:53  AI大模型的发展趋势

00:50:02  非技术从业者的学习建议

00:55:43  对AI产品经理的建议

节目简介:

人生之路,不管陷入低谷、还是站在高峰,不管走多远、走到哪,终究会走到一条自我发现、自我修炼的道路上。我是Summer,前腾讯11年产品负责人,多年ToC+ToB业务和管理经验。会在这聊聊职场发展、产品成长、人生选择相关话题,不求热点、卖点,只求真诚、真心。

与我联系:

  • 微信-fruitjellycc(提供职场教练、AI职业咨询、企业内训服务)
  • 公众号&小报童-向心修炼
  • 即刻-Summer喵老师

BGM:

《Peaceful Melody》- abcdefu

展开Show Notes
五里坨
五里坨
2023.9.18
37:39 但没办法,大老板又没有技术背景,觉得 torch demo 一个 sop 跑通花钱去量子位和机器之心上刷pr稿,没人关心真做了啥,以及工程团队会不会累死。美名其曰扩大行业影响力。这帮老板甚至tmd还不愿意加人头,然后转眼俩连 python 都写不利落的实习生,又要搞全新的 fancy stuff了。
Summer喵老师
:
哈哈看来兄台在这个刷影响力的背景中有切肤体会
五里坨:真的,不如直接放过我们工程人,idea 直接发 pr 就行,反正量子位上发的东西也没人去复现wwwwww
3条回复
五里坨
五里坨
2023.9.18
19:52 这个事看论文学界似乎还没有共识,毕竟大模型其实大家知道的也只是这个东西莫名其妙的 work(悲)
周声:其实程序员们也并不知道编译器是怎么回事,能跑就行😏
五里坨:多数是这样的,但我们这种做加速优化的,还真的会改 clang(瞥)
5条回复
0xXuan
0xXuan
2023.9.18
超哥介绍ai研发流程及工作模式
本期节目邀请到AI人超哥,从算法工程师的视角介绍了AI研发的流程和技术原理,包括问题定义、模型选择、数据处理、实验改进等。同时还探讨了非AI从业者学习AI的建议和AI产品人的工作定位。节目内容丰富,干货满满。此外,超哥还预告了转型到AI领域的机会,对于想要转型的人士提供了付费咨询的服务。
大模型对ai工作的影响

Ai算法的价值在哪里
本对话片段讨论了大模型对AI的影响以及算法和数据在AI中的重要性。讨论涵盖了AI算法的不同方式、算力、数据和算法的相对影响、AI算法工程师的价值、大模型的范式以及模型规范化调研的必要性。同时,还提到了推理加速、模型规模与数据量的关系以及模型压缩和变大的挑战。

讲述长宽的具体意思
这段对话讨论了深度神经网络的层数与模型复杂度的关系,以及模型宽度与效果的影响。对话还涉及了算法的价值与任务解决的关系,强调了在企业中算法应该为产生价值和提高效率做出贡献。

数据的重要性和模型的顺序
对话中讨论了数据在大模型训练中的重要性与困扰。举例说明了在模型迁移过程中,如何处理数据顺序以及如何利用已有模型进行微调。同时讨论了数据的顺序对模型结果和产品平台的影响。此外,对于大模型的底座模型训练和具体任务训练,也提到了数据的需求量和学习效果。最后,提到了大模型的研究者对于其原理的不了解,以及对于其未来发展的担忧。

数据的重要性及大模型的难点
该对话片段讨论了大模型与数据的关系以及数据在大模型训练中的重要性。讲述了在不同场景下,数据的需求和使用方式。还提到了数据工程在大模型训练中的重要性,以及数据处理、标注和加工的成本和难点。最后,强调了数据处理和训练对于公司之间差距的拉开的重要性。

Ai模型的评价方法和工作能力
评价模型的好坏是一个非常复杂且难以做出通用标准的事情。国内的模型常常通过对比评测指标和刷榜来证明自己的能力,而OpenAI等国外公司则更注重模型的实际应用和工程优化。在使用大模型时,工作能力和模型利用的优化也是关键因素。此外,刷榜的意义有限,真正有意义的工作是认真踏实地做实验并记录整个过程。只有投入更多的资源和卡顿,才能追上领先的模型。

大模型的技术演进会决定不同的公司
对话片段中讨论了大模型技术的两个主要方面:成本和理想追求。成本方面涵盖了训练速度和资金的重要性;理想追求则讨论了技术追求和出发点的选择。此外,还提到了大模型在算力和资源限制下的难点和挑战,以及高校和学术界受到的影响。整体而言,大模型技术的进展和能力提升给算法人员带来了新的机遇和挑战。

强化学习的应用卡
该对话片段讨论了国内在强化学习应用方面的困难和挑战,以及人类对齐和调试等关键问题。对话还提到了OpenAI在人类对齐方面的进展和未来的影响。发言人认为,强化学习的训练成本较低,但在技术和应用方面仍存在很大的难度。未来,强化学习模型的能力将会突破,并在移动设备等领域得到广泛应用,对社会产生长远的影响。

云厂商的重要性和成本极其低
本对话片段讨论了大模型与云服务的紧密关联,认为大模型的发展离不开云厂商的经验和资源支持。同时,对于人工智能的未来以及智能是否会超越人类的存在产生了讨论,引发了对于AI行业的探索和商业价值的思考。此外,对于个人创业和大公司在AI领域的优势与挑战也进行了讨论,认为个人创业的成本将变低,而大公司在某些领域的优势将减弱。最后,大模型的应用场景将变得更加广泛,创造更多的商业价值。

非技术人员学习的建议
非技术人员如何学习技术?建议学习大模型的使用和优点,并通过验证来学习和提升。可以先从使用一个大模型开始,然后不断尝试和验证,利用提示词加深对模型的理解。在某个垂直行业中,掌握数据转换和评测模型的能力,持续反馈和改进。需要关注技术的变化和趋势,可以关注大咖的发言和最新的研究进展。

Ai产品经理的工作建议
对话中提及了关于AI产品经理合作的建议,包括迭代意识、数据依据和技术边界。同时强调了懂技术和靠谱的技术合作伙伴的重要性。
Summer喵老师
:
迎来本播客评论长度之最....好奇是哪个AI伙伴哈哈
双_tv1a
双_tv1a
2023.9.18
又在博主这里发现了一个同事,之前是玉洁,现在是李超,哈哈哈
Summer喵老师
:
这么巧的嘛,来! give me five!
Float
Float
2024.5.23
19:53 先mark一下