- 一起微调llama3,做自己的大模型!
随着Llama 3的发布,国内各路英雄豪杰纷纷开启了炼丹之旅。Llama-3 8b在惊人的15万亿令牌上训练,而Llama-2仅为2万亿。毋庸置疑,Llama 3目前是开源大模型中能力最强的!其跑分成绩已经赶上了GPT-4。 然而,Llama3的优势不仅限于此。作为开源大模型,每个人都可以对其进行个性化的定制,这意味着相比GPT,它具有更强的定制性和安全性。另外,Llama3 8B的模型可以在内存只有8G的树莓派上运行,对于计算机资源的依赖比以往都要低,人人都可以本地部署Llama3,可应用于针对B端企业和各种场景下的自然语言处理、机器翻译、文本生成、问答系统、聊天机器人等场景。 目前,我们主要通过微调(Fine-Tuning)来定制所需的模型。例如,Llama 3原生不支持中文,但我们可以通过微调让它支持中文。 什么是微调(Fine-tuning) ?这是机器学习和深度学习中的一个术语。它指的是在预训练模型的基础上,使用特定任务的数据集进行额外训练的过程,目的是让模型更好地适应特定的任务或问题。通过微调,我们可以调整模型的参数,使其更精准地解决特定问题。 就像一个已经非常了解世界的成年人。现在,我们需要它去学习一些更专业或更具体的知识。微调的过程,就像是对这个成年人进行一些专业培训,使其在特定领域更加精通。 为了帮助大家更好的理解什么是“微调”,我前天写了一篇轻松的入门教程《Llama3微调教程:超简单,人人都可以打造属于自己的GPT!》: 地址:https://mp.weixin.qq.com/s?__biz=MjM5NDIzOTg0Mw==&mid=2448257753&idx=1&sn=627c94e8b0d66bc9866ab4a42edaaa73&chksm=b29316d585e49fc312553b5efaca684af566be55237b8c4e2a1d9a472dd31f7ee74157c08163&token=1764237450&lang=zh_CN#rd 就算你不懂技术也没有关系,通过这个简单的Llama 3微调案例,我们可以免费体验整个大模型微调的过程。你可以学习到AI工程师是如何进行环境配置、数据准备、模型训练、模型运行、模型保存以及本地模型使用。 这对于大多数普通人来说,这是一个免费体验AI工程师工作方式的机会;如果你想转入AI行业,这也是一个很好的入门案例。 你可以通过我的微信公众号“PM熊叔”浏览。 另外在Shownots中,我列出了目前已经微调好的Llama3作品,大家如果有兴趣可以体验一下。 愿每个人都能从中受益,开启自己的AI探索之旅! 以下是一些微调的llama3的作品: llama3-Chinese-chat-8b:https://wisemodel.cn/models/shareAI/llama3-Chinese-chat-8b Instruct + 进行中的中文sft版本:https://modelscope.cn/models/baicai003/llama-3-8b-Instruct-chinese_v2/summary 联通微调版本:https://www.modelscope.cn/models/UnicomAI/Unichat-llama3-Chinese/summary Openbuddy微调版本:https://www.modelscope.cn/models/OpenBuddy/openbuddy-llama3-8b-v21.1-8k/summary 破解安全限制系列(目前仅支持英文): Unholy:https://huggingface.co/Undi95/Llama-3-Unholy-8B neural-chat:https://hf-mirror.com/Locutusque/llama-3-neural-chat-v1-8b 聊天机器人:https://huggingface.co/cognitivecomputations/dolphin-2.9-llama3-8b Bunny-Llama-3-8B-V(多模态图文版本):**https://wisemodel.cn/models/BAAI/Bunny-Llama-3-8B-V 我的公众号:
- 人工智能经典《苦涩的教训》聊聊背后的思考
今天要介绍的这篇文章《The Bitter Lesson 苦涩的教训》是由知名计算机科学家,阿尔伯塔大学、DeepMind的神经网络专家Rich Sutton 在 2019 年发表的,主要讨论了在人工智能研究中一个重要的观察:当简单的算法能够利用大量的计算资源时,往往会胜过依赖于人类专家洞察力的复杂算法。 在回顾AI历史上一些关键进展时,Sutton指出,虽然研究人员曾多次尝试通过设计复杂且模仿人类理解的算法来提升机器学习模型的表现,但通常更简单、更基本的方法,只要能通过增加计算能力进行扩展往往能取得更佳效果。他强调了规模和算力的重要性,并认为未来的研究应该更多依赖于扩算力,而非复杂的设计。 OpenAI 在2021年的论文《神经语言模型的缩放法则 Scaling Laws for Neural Language Models》讨论了AI模型的性能如何随模型大小、数据集大小和训练计算量的规模提升而提升。 今天,在缩放法则(Scaling Laws)的加持下,简单的Transformer架构让GPT等大语言模型涌现出了“智能”,也展示出了AGI通用人工智能的可能性。 现在就让我们来读一读,回顾这篇经典文章。 苦涩的教训 Rich Sutton 2019年3月13日 我们从70年的人工智能研究中可以得出的最大教训是,利用计算的通用方法最终是最有效的,而且差距很大。其根本原因在于摩尔定律,即集成电路上可容纳的晶体管数量每隔18-24个月会翻倍,从而使芯片性能指数倍增。 大多数人工智能研究都是在假设智能代理可用的算力资源是恒定,在这种情况下,利用人类知识是提高性能的少数行之有效的方法之一,但在略长于典型研究项目的时间内,大规模的计算量又不可避免地会变得可用。 研究人员寻求在短期内实现改进,试图充分利用他们对特定领域的人类知识来节省算力成本,但从长远来看,唯一重要的是利用计算资源。这两者不必相互对立,但实际往往如此。由于对一种方法的投资存在心理承诺,我们在一个东西上花费大量的时间,就不会在另一个上花费更多时间。而且,基于人类知识的方法往往会使方法复杂化,使其不太适合利用计算的通用方法。这些案例不胜枚举,我称之为苦涩的教训。 作为人工智能研究者,我们学习这些教训是有指导意义的。下面,我们来回顾其中一些最知名的案例。 在1997年,计算机国际象棋领域见证了一个历史性的事件——计算机通过大规模深度搜索击败了世界冠军卡斯帕罗夫。当时,大部分研究者都倾向于利用人类对棋局结构的深入理解来设计算法,这一失败让他们颇感挫败。当一个相对简单的基于搜索的方法,结合先进的硬件和软件展示出惊人效力时,依赖人类知识的方法显得力不从心。这些研究人员对于“蛮力”搜索的胜利持怀疑态度,认为虽然这次有效,但它并非一种普遍适用的策略,也不符合人类下棋的风格。他们曾希望能通过更贴近人类思维的方法取得胜利,因此对结果感到失望。 计算机围棋的研究历程展示了一种类似的发展模式,但这一过程比其它领域晚了大约20年。初期,研究者们尝试通过利用人类的棋局知识和游戏特征来减少搜索需求,但随着搜索技术在规模上的有效应用,这些努力最终被证明是无效甚至有害的。同样,自我对弈的方式学习价值函数也显示出其重要性,这种方法不仅应用于围棋,在国际象棋等许多其他游戏中也同样适用,尽管在1997年首次战胜世界冠军的程序中,学习的作用不大。自我对弈不仅是学习的一种方式,它像搜索技术一样,使得可以利用大量计算资源。搜索和学习是利用大规模计算的两个关键技术,在计算机围棋和国际象棋的研究中,尽管研究人员最初依赖于人类的理解来减少搜索的需要,但最终还是通过采用搜索和学习技术取得了显著的成就。 在语音识别领域,20世纪70年代DARPA主办的早期比赛中,参赛者采用了包括人类发音知识在内的各种特定方法,例如对单词和音素的认识。相对的,一些新的统计方法采用了更多的计算,并基于隐马尔可夫模型(HMMs)进行操作。结果显示,统计方法优于那些基于人类知识的方法,这一发现推动了自然语言处理领域的重大变革,并在随后的几十年中逐渐成为主流。深度学习在语音识别中的崛起标志着这一发展方向的进一步演进。 深度学习方法较少依赖人类知识,而是利用大量计算资源,通过在庞大的训练数据集上进行学习,显著提升了语音识别系统的性能。研究人员原本希望开发出能模仿人脑工作方式的系统,并尝试将这种理念应用于他们的系统设计中,但这种方法最终被证明是适得其反,甚至是对时间的浪费。尤其是在摩尔定律推动下计算能力大幅提升并找到有效利用方式的背景下,这种做法更显得没有必要。 计算机视觉领域也遵循了相似的发展模式。在早期,研究者们试图通过识别边缘、圆柱形等广义结构,或使用SIFT特征来处理视觉信息。然而,这些方法如今已被淘汰。现代的深度学习神经网络主要采用卷积技术和某些类型的不变性处理,并且在性能上有了显著提升。 这一趋势给我们的教训是深刻的。作为一个领域,我们似乎还没有完全吸取这一教训,因为我们依然重复着相同的错误。要真正理解这些错误的诱惑,并有效地避免它们,我们需要认识到依据我们所认为的思考方式构建方法最终可能不会奏效。这是一个我们必须接受的苦涩教训。 从这些历史经验中,我们汲取了一些重要教训: 1 )人工智能研究人员经常尝试将人类的知识整合到他们的智能系统中。2) 短期内,这种方法似乎总是有益的,并且能给研究人员带来满足感,但长远来看,它可能导致发展停滞,甚至阻碍进一步的创新。3) 真正的突破通常来自于完全相反的策略,即通过扩展搜索和学习能力来充分利用计算资源。尽管成功令人欣慰,但这种成功往往带有苦涩,因为它是在放弃了受青睐的、以人为中心的方法后才实现的。 从这些经验中我们应该学习到的第一个重要启示是,通用方法的强大力量在于其扩展性,即使在可用计算资源极大增加的情况下也能持续有效。搜索和学习是目前看来能在这种环境下无限扩展的两种方法。 第二个重要启示是,关于大脑的实际工作原理的极端的复杂性;我们应该放弃试图以简化的方式来理解大脑的工作,如简单地处理空间、物体或对称性等。这些概念都是外部世界中复杂性的一部分,本质上是难以简化的。试图将这些复杂性内置于系统中是不切实际的。 相反,我们应该专注于内置能够探索并捕捉这种任意复杂性的通用方法。这些方法的核心优势在于它们能找到有效的近似解决方案,但寻找这些解决方案的过程应该是自动的,而不是依赖于我们的直接输入。我们希望人工智能代理能够自主探索和发现,就像我们一样,而不是仅仅复制我们的现有知识。将我们的发现硬编码到AI系统中,不仅限制了系统的学习潜能,还加重了我们理解这些发现过程复杂性的困难。 观点 Rich Sutton《苦涩的教训》原文到这里就结束了,我想聊聊我自己的观点和感悟: 人类总是习惯将自己对于世界的认知注入于亲手打造的系统之中,但是历史一次又一次的证明这种有效性只是短期的,从地心说到日心说,从经典力学到量子力学,从专家系统到大语言模型,当每一次科学革命到来之时,那些越是符合直觉的经典理论越是岌岌可危。 《金刚经》有云:“一切有为法,如梦幻泡影”,我们当前观察到现象和规律,可能都只是暂时的。那这个世界运转的逻辑到底是什么? 设想一下,如果你是这个宇宙的程序员,拥有无穷的时间和算力资源,你会如何设计这个世界? 智能设计论者说:沙漠中不会凭空产生精美的手表,所以精密的人体一定是被有意设计出来的。但是你作为一个想要摸鱼的程序员,其实对于细致入微的设计全宇宙中所有的生命体可能并没有太大兴趣,你只关心能否用最简单的算法让DNA持续地演化,演化出智能体,再让他们做那些你不想做的事情。 遵循“缩放法则(Scaling Laws)”依然是你最佳的选择,因为你不用操心这个宇宙的每一个角落的细节,你只要设计最基本的法则,并允许系统在这些法则指导下自我组织和进化,剩下的事情交给无限的时间和算力就好了。 正如480年前,哥白尼坚信上帝相信简洁优雅的规则,因此有了日心说:“天体运动的真实模型应该是基于数学的完美和简洁,而日心模型相比地心模型在数学上更为简洁和优雅”。 而今天,AI领域的进展告诉我们“简洁优雅的数学模型”依然有效,只要简洁的设计和上大尺度的数据训练,就能拥有强大的鲁棒性和智能性的系统。 佛法有云:“缘起性空;自见成佛”。这可能才是我们这个世界的本来面目。 欢迎订阅我的播客和知识星球。
- 聊聊Mixlab Node:AI时代如何重塑内容创作产品与社区生态
前天,我参加了洪宇的《遇见AIer》的播客节目的录制,聊了聊ComfyUI的Mixlab Node背后的故事和AI产品经理关心的一些话题。如果感兴趣,大家可以去听下这期节目。 # 缘起 2023年10月,我和Shadow一拍即合,共同发起了“ComfyUI中文爱好者社区”,并把Mixlab Node纳入了议程。目前,社区已聚集了超过1000名ComfyUI创作者,包括行业内的ComfyUI大咖。Mixlab Node目前已获得600多个星标。 https://github.com/shadowcz007/comfyui-mixlab-nodes 我和Shadow都对AI创作工具及社区抱有浓厚兴趣。去年,我们见证了AnimateDiff和ComfyUI的崛起,并意识到国内迫切需要一个ComfyUI学习社区。这不仅为AI创作爱好者提供了一个交流和学习的平台,也吸引了一批热情的开发者和创意人才来共同开发ComfyUI的插件和工作流,这也促成了Mixlab Node的诞生。 # 社区驱动型产品 简而言之,Mixlab Node是基于Stable Diffusion和ComfyUI构建的节点工具。它的核心特色在于ComfyUI的高度灵活性,通过模块化设计让各种插件(或称为节点)能够无缝串联。这种设计使得用户可以轻松调用各类AI模型和处理模块,完成从图片生成到视频制作,甚至是接入大语言模型进行互动游戏的多样化工作流程。 ComfyUI的开放性和模块化让开源社区的开发者能够迅速整合最新技术和模型到用户的工作流中,而我们的MixLab Node就是其中之一。 Mixlab Node最大的特点就是“社区驱动开发”,在我们社群里面,开发者和创作者每天都会讨论大量的新技术动态和使用需求。我们的功能往往源自社区内部的实际反馈,确保了产品的实用性和创新性。 例如,Mixlab Node加密功能正是基于社区反馈而生。当时我们社群中的一些大佬的工作流被一些人冒名顶替,引起了社群内的广泛关注。开源并不是做慈善,一个良性的生态环境,既要开放共享又要尊重个人创作权益,这样开源才有持续发展的动力。所以我们想有些工作流只有通过原作者提供密码才能继续使用。通过这种方式,不仅可以让创作者的原创作品免受盗用,还可以让优秀的创作者更好地活下去。 相似的案例不胜枚举。Mix Node正是在这样一个开放、共享的环境中不断成长和优化的。通过与社区成员的紧密合作,形成了一个积极的、自我增强的闭环系统。这不仅推动了MixLab Node不断完善和进步,也为开源的AI创作贡献了自己的一份力量。 # JUST DO IT的开发模式 我和Shadow的首先达成的共识是,在AI时代我们必须要抛弃掉传统的思维方式。 在传统的软件和互联网产品开发过程中,从需求收集到产品发布通常需要经历多个步骤,包括需求分析、文档撰写、评审会议,以及最终的开发迭代,这一系列过程往往耗时长达数周,然而,由于AI技术快速迭代,这种模式很难跟上技术进步的步伐。 我们更提倡“Just do it”——有好的想法,那就先做了再说。我们直接从社区收集到好的创意就可以开始动手做开发,不需要给领导写报告,不需要撰写需求文档,更不需要走评审流程,做好后交给社群中的小伙伴们测试反馈。只有这样我们才能打造出更酷的节点。 另外,通过使用GPT,可以把开发的时间极限压缩。例如,我们在GPT的帮助下,只花了1到2天内完成录屏工作流的开发和上线,这放在传统企业,起码两周才能搞定。 录屏的需求的灵感来源于我们自己的创作视角的切换,我和Shadow都曾做过设计师,我们都想把自己的草图让AI重新渲染,但是主要的创作工具都在PS等传统软件上 ,因此想了个录屏功能,然后再考虑如何通过技术手段来实现。最后,我们发现录屏节点搭配LCM模型可以快速将草图变成精美的图片,这个功能出了以后,社区里面创作者也反馈非常积极,得到了很好的验证,也给我们带来了极大的成就感。 “Just Do It”模式并不完美。随着MixLab Node功能的不断丰富,产品逐渐变得庞大,这引发了关于用户认知清晰度的担忧。Shadow建议是先集中实现功能,然后再考虑精简和优化。我们最终的期望是提供更完整的软件产品体验,而不仅仅是单一功能的模块。 虽然初期采取“Just do IT”的策略有其必要性,但随着时间的推进,我们也会考虑如何降低用户的学习门槛。因此,在接下来的发展方向上,将包括开发教程和案例,帮助用户更好地理解和利用MixLab Node,同时也探索新的商业模式以确保项目的可持续性。 # AI赋能个人成长 在开发MixLab Node过程中,ChatGPT和GPT-4在提升开发效率中起到了关键作用。 我以前做过前端开发,熟悉Javascript,但是对于Python一直都是一知半解。从前要掌握新的技术领域,我通常需要购买在线课程或书籍,先自学清楚然后才能动手实践。但是今天,我们只要向AI提出功能描述,它就能生成代码。通过持续地调试和优化,我们就可以实现所需要的功能。这种方法极大地缩短了学习与开发周期,仅仅三年前,这样的场景还是难以想象的。 通过与AI工具的协作,即使是非专业程序员也能拓展自己的技术领域,提高对新技术的适应能力和问题的解决能力。 在未来,真正能够称之为“精英”的,将是那些具备鲁棒性和深刻业务理解的人。 鲁棒性也是称之为说泛化能力,是指你不会将自己限定在特定的岗位角色中。通过有效利用AI,你可以跨领域地解决问题。 此外,深刻业务理解能力也依然重要,这样你才能识别并聚焦于有价值的真问题。这样全面的技能和视野,将使你在AI时代中突破重围,不仅仅是完成别人给你的任务,而是成为解决关键问题的关键人物。 # 成为AI产品经理 首先,无论是哪个领域的产品经理,基本功是必不可少的。这包括但不限于对需求的深刻分析与洞察、对用户和产品的深入理解。这些技能对所有产品经理来说都是共通的。当然,AI领域的特殊性在于,你需要对底层的技术手段有所了解,了解它们的潜力和限制。 其次,运用AI能力不能异想天开。许多人有过高的期待,认为AI可以做到任何事,但实际上它的能力是有限的。我们需要理解这一点,并能基于此制定合理的产品策略,是AI产品经理的重要技能之一。 因此 ,产品经理需要掌握目前流行的AI工具和“提示工程(Prompt Engineering)”。因为在AI的世界里,你需要知道如何与AI进行有效地交流,才能扮演好“用户与AI之间的桥梁”。更重要的是,当AI的回答不尽如人意时,需要知道如何调整你的产品方案,让它能获得更好的结果。这背后的逻辑和优化技巧,是很多传统产品经理所缺乏的。 然后,培养自己的对社群的感知能力。AI产品的开发和迭代,往往需要用户的直接参与和反馈,需要建立和维护一个活跃的创作者社群。只有更接近用户,更好地理解他们的需求和期望,从而共同创造出更符合用户需求的产品。 AI产品经理不仅要有坚实的基本功,还要懂得如何与AI合作,如何与用户合作,搭建AI与用户的桥梁。我相信,只要你愿意不断学习、实践并保持开放的心态,你一定能在AI时代的产品管理领域中找到属于自己的位置。 # 尾声 在这个迅速变化的时代,开放的创新文化和社区的集体智慧将成为推动技术前进和个人发展的核心力量。这不单单局限于开源AI工具或社区的构建,而是关于在AI的浪潮中我们如何持续创新、适应变革,并推动个人的成长。 我们不仅需要重新审视传统的开发模式、学习方法和工作理念,还思考如何作为个体和社区共同前进。这对于任何在快速演进的世界中寻找自己定位的人来说都是深刻的思考题。 我们不仅只是学会适应,还需要积极参与到变革过程中。我们既是技术进步的贡献者,也是个人及社区繁荣发展的推动者。 欢迎加入“ComfyUI中文爱好者社区”!
- AI时代,程序员会失业吗,还需要学习编程吗?
最近越来越多人在问类似的问题,AI都那么厉害了,还需要学编程吗?计算机专业依然吃香吗?特别是昨天很多人看到了Devin AI,更是产生了一种“是不是程序员要失业了?”的疑问。 # AI 程序员能做什么? 就在前几天,仅仅成立两个月的公司Cognition发布了一款Devin AI 的产品。它被宣传为史上第一款AI程序员。在演示中,Devin AI拥有自己的命令行、代码编辑器和浏览器等工具,可以自己制定计划、执行任务和解决问题,它可以独立完成整个软件的开发和构建的工作。 另外,根据官方宣传,Devin甚至拥有“成长”的能力,它可以通过阅读文章,学习原先不懂的技术,还会自主寻找程序中的错误,并且进行修正。 从宣传来看,Devin要比之前Copilot类似的AI编程助手要更进一步,更像一个能够独立完成开发任务的程序员。这不仅代表着AI独立完成开发工作的可行性,也激发了公众对“AI是否能替代程序员”的讨论。 也有网友分析,其实Devin AI并没有想象中的那么厉害:首先,Devin的底层技术是基于GPT4,它的使用成本比普通程序员更高;其次,程序员的面试题并不难,ChatGPT也能胜任;还有就是执行的任务过于简单,和人类相比还是有较大差距。所以,人类程序员目前还是比较安全的。 虽然如此,但是随着大语言模型的性能越来越好,在可预见的未来,AI程序员必然将软件开发过程中起到关键性的作用。 # 有了AI还需要学编程吗? 会不会现在学了编程,以后就没用了? 我想这个问题可以类比为“有翻译软件了还需要学英语吗?”我相信很多人回答是:学习英语依然重要。 诚然,英语已经成为许多人综合素质的一部分了。翻译软件不能百分百解决我们的需求。例如,要查询最新最全的论文和资料,懂英语可以让我们无损获得原本的信息,而翻译软件只是方便我们快速的浏览和过滤信息的工具。另外,学习英语不仅仅是学习语言,也是学习一种文化和思维方式。这样我们才能更好地与世界接轨。同样的逻辑也适用于AI和编程。 首先,编程只是软件开发的一部分,编程是打开计算机世界的一把钥匙,计算机科学的复杂性远远超出了编程本身。它包括系统架构设计、网络安全、需求分析、用户体验和项目管理等诸多方面。这些综合性的知识和技能,才是软件创新基础。即使AI能够自动化编程任务,也需要人类来解决更复杂的问题,需要人类保持对行业趋势的敏锐洞察,他们需要理解业务需求,与非技术背景的团队成员进行有效沟通,确保技术解决方案能够满足业务目标。 另外,编程不仅仅是写代码,它是解决问题的一种方式,也是一种思维训练。学习编程能够帮助人们培养逻辑思维、系统思维、创新思维以及动手解决能力。这些能力在AI时代尤为重要,不仅限于技术领域,同样适用于生活的各个方面。随着技术的不断进步,新的工具和平台层出不穷,个人需要能够适应这些变化,还要能在变化中找到创新的机会。这种适应力和创新力对于个人发展、职业生涯乃至企业的竞争力都是宝贵的资产。 除此之外,编程并不是计算机学科的专利,它也是一种跨学科学习工具。在尝试解决来自不同领域的复杂问题时,编程能够通过数据分析、可视化、机器视觉和仿真模拟等技术手段,帮助整合和应用多学科知识,从而促进创新解决方案的产生。这种跨学科的视角不仅拓宽了我们的思维,也为AI程序员的任务分配提供了更加清晰的指导。让我们能够从更综合的视角理解和应用技术,进而更有效地推进项目和研究工作的进展。 其实,AI本身还有很多需要迭代的地方。例如,AI科研论文、设计AI算法、提升AI性能、定制AI模型以及AI伦理安全方面,人类依然扮演着无可替代的角色。换句话说,正是因为AI的发展,为计算机专业人才创造了更多的挑战和机会。对于准备想实现自己的想法人来说,现在是学习编程的最好时机,学习编程可以更好地应用AI的能力,帮助我们实现很多的创意和想法。 因此,面对“有了AI还需要学编程吗?”这个问题,我的回答是:绝对需要。 # 讲讲我的经历 我大学是学工业设计的,算理工科中的文科专业。原本编程这件事情对我来说是一件很有畏惧感的事情,大学仅有一门C语言差点挂科。但由于我对于互联网一直感兴趣,还有自己做产品的冲动,所以我临近毕业的时候,去学习了编程和软件工程相关知识。而之后又做了程序员、产品经理还有创业者,一路走来,有挫折也有收获。 过去,我经常刻意隐瞒自己做开发的经历,生怕别人认为我的职业定位不够专注。但是多年以后发现能帮助到我的恰恰是跨学科能力。 如果今天你是一位想自主创业的产品经理,究竟学过编程和不会编程的人在做产品方面到底有什么区别? 首先,学过技术的产品经理在理解技术层面的细节上有明显优势。能更好地与研发团队沟通,能更精确地传达需求,能更好地理解团队面临的挑战,并在技术可行性和资源分配方面做出更合理的决策。这种深入的理解有助于建立团队成员间的信任和尊重,从而促进团队合作和项目的顺利进行。在这些年里,我和大部分开发同事之间都维持着不错的关系,因为团队合作没有什么比理解更重要了。 其次,具备编程背景的产品经理在设计产品时,能更好地考虑到实现的复杂性和成本,会更重视需求价值,可以更好地制定MVP(最小化可行性产品)策略。特别在产品的早期规划阶段,你就能预见到某些功能的实现可能会遇到的技术障碍,不会把产品功能设计得过于复杂或者理想化,从而在设计上做出更加现实和经济的选择。让产品赢得了低成本地快速验证市场的时间。这种前瞻性不仅能够节省开发时间和成本,还能避免在项目后期进行大幅度的修改,提高了产品开发的效率和成功率。 再者,了解技术原理,也能够让我们更好地把控产品体验。会去主动思考影响产品体验的技术指标,不会想当然地做一些脱离实际场景的理想化的功能。通过能够更好地评估不同设计方案的技术实现难度,能在设计和功能性之间找到最佳平衡点。这样的产品经理能够推动设计和技术团队更紧密地协同工作,共同创造出既美观又高效的产品。 此外,编程经验还赋予了产品经理对新兴技术的敏感度和适应能力。AI时代,新技术层出不穷,具备技术背景的产品经理拥有较强的技术的敏锐度,能够更快地理解这些新技术如何被应用到产品中,以及它们对市场和用户体验可能带来的改变。例如,我经常会去Github上查看一些有趣的开源项目,学习一些新的技术课程,也会思考如何把它们应用到自己的项目和工作中。这种能力使得产品经理能够领导团队走在技术发展的前沿,创造出创新和有竞争力的产品。 最后,通过学习编程,我还获得了一系列强大的思维工具,包括面向对象的编程思想、设计模式、以及统一建模语言(UML)等。这些工具提升了我的逻辑思维和系统思考能力,教会了我如何将复杂问题逐步分解成可管理的小任务,帮助我们对问题进行抽象和建模,让我更好地理解事物的运转模式,从而找到机会点。这在产品规划、市场分析还是项目管理中,都极大地帮助了我。 步入生成式AI时代,大语言模型已经成了我不可或缺的助手。以往有很多灵光一现的创意,因为我的技术视野的限制而无法实现,它们最终只能沉睡在我的思绪中,逐渐被遗忘。但如今,我的一些突发奇想的灵感交给了GPT之后,它能很快地生成代码。虽然代码可能充满了错误,但GPT帮我快速拓展了技术视野,引导我去深入研究,并让我能对代码进行细致优化。例如,我在ComfyUI的Mixlab-Node的开源项目的开发过程中,有很多想法的实现就是通过与GPT协作来完成。 因此,作为一名独立开发者或产品经理,我们应当把AI程序员视作一位协作伙伴。正是因为有了它的帮助,让我们可以在实现更有趣的功能的同时,节省下更多时间,让我们可以用来考虑赚钱的事情。 # 总结 当我们面对Devin这样的AI程序员的时候,我们并不要为程序员岗位感到过于的担忧。编程将会变成像外语一样的普遍性能力,人类通过学习编程,我们可以更好地发挥机器的能力。 在AI的帮助下,越来越多的普通人可以实现自己的创意和想法,成为自己事业的掌舵人。在AI时代,必然是超级个体崛起的时代。 在传统企业管理中,员工们扮演的是流水线上的零件。但是在这个AI变革的新时代,我们不应当把自己角色局限在某个零部件上,拥有灵活的思维、开阔的视野和敏锐的洞察力显得更为重要。 只要我们把握好时代趋势,技多并不会压身。请快行动起来吧! 欢迎加入ComfyUI中文爱好者社区,ComfyUI是一套灵活的AIGC工作流搭建工具。目前我们集结了一群跨界的设计师、程序员 产品经理和创业者。我们正在探寻AI的生成技术在各行各业的解决方案,每日社群里面都会有高质量的讨论。
- SORA会是职业发展的革新引擎吗?【下】
窜台参与麦田老师的播客录制, 欢迎大家订阅她的播客专辑《麦田的职场圆桌会议》 AI能成为你的小情人吗? AI如何感知我们的情绪? 科技飞速发展下,我们如何抓住机遇,而不被AI? 本期播客带你深入探讨AI时代,我们该如何勇敢面对挑战,拥抱变革,用知识赋能自己的人生旅程!跟我一起思考,变得不可替代! 【本期嘉宾】 郝俊慧: 《IT时报》主编 资深媒体人 在科技报道领域深耕近20年,长期关注互联网、信息通信、人工智能等前沿科技。《IT时报》是中国最早的通信类媒体之一,前身为《上海邮电报》,具有近60年的产业传播历史。 鑫声心生 :化学博士,双一流大学材料学科博士生导师,喜马拉雅播客智库成员,在职业规划,前沿科技方面著有多部学术著作,喜马拉雅《七点早知道》、《消息拌饭》等栏目担任特约嘉宾。 曾主持多项国家与省部级科研项目,在国际高水平期刊发表论文50余篇,授权国家发明专利5项,受邀在国际学术会议作报告10余次,担任碳中和领域知名期刊Carbon Capture Science & Technology(碳捕集科学与技术)创刊编委。生物质产业碳中和技术联盟东北区负责人,国际碳捕集协会(IACC)执委。 PM熊叔:产品经理/设计师/程序员,研究方向是AI创作工具和创作社区Mixlab无界社区和ComfyUI爱好者社区发起人 02:01 AI的快速发展:挑战与机遇并存,我们应该怎么办? 04:04 AI监管与安全性:全球共识的挑战与前景展望 06:05 人工智能带来的变革:找到共识的挑战与前景展望 09:03 人工智能工具的崛起对影视制作行业的影响及未来职业变革 12:05 AI时代的创意表达:掌握AI技能,成为多功能手的可能性 15:10 人工智能时代的个人成长:如何提升效率与竞争力? 18:09 培养孩子独立思考能力:保持想象力与逻辑分析能力的平衡 21:13 培养孩子立体人格:中学阶段学习的重要性与魅力 24:15 通用能力与专业能力:职场中的人才选拔与培养 27:18 培养孩子自主学习的能力:AI时代的关键竞争力 30:20 拓展认知,提升独立判断能力,迎接人工智能时代挑战 33:22 勇敢拥抱人工智能,迎接时代的变革!
- SORA会是职业发展的革新引擎吗?(上)
窜台参加麦田老师的《麦田的职场圆桌会议》 欢迎大家订阅她的播客专辑。 【本期嘉宾】 郝俊慧: 《IT时报》主编 资深媒体人 在科技报道领域深耕近20年,长期关注互联网、信息通信、人工智能等前沿科技。《IT时报》是中国最早的通信类媒体之一,前身为《上海邮电报》,具有近60年的产业传播历史。 鑫声心生 :化学博士,双一流大学材料学科博士生导师,喜马拉雅播客智库成员,在职业规划,前沿科技方面著有多部学术著作,喜马拉雅《七点早知道》、《消息拌饭》等栏目担任特约嘉宾。 曾主持多项国家与省部级科研项目,在国际高水平期刊发表论文50余篇,授权国家发明专利5项,受邀在国际学术会议作报告10余次,担任碳中和领域知名期刊Carbon Capture Science & Technology(碳捕集科学与技术)创刊编委。生物质产业碳中和技术联盟东北区负责人,国际碳捕集协会(IACC)执委。 PM熊叔:产品经理/设计师/程序员,研究方向是AI创作工具和创作社区Mixlab无界社区和ComfyUI爱好者社区发起人 【精彩观点】 02:02 AI时代来临,对职业发展和创业的影响有多大? 04:04 AI生成视频:从拼图到动画的突破之路 06:06 SORA视频生成技术的突破:从拼图到现实世界的模拟器 09:12 技术的飞跃:从三维建模到真实世界模拟的突破 12:16 真相与谎言:人工智能改变我们对现实的认知 15:19 职业规划与人工智能:拥抱变化,迎接挑战! 18:23 人工智能时代下的专业型人才培养:挑战与机遇 24:32 AI时代的就业挑战:如何寻找新的创意与发展机会? 27:35 AI时代的独立思考与持续学习:文科生、程序员、咨询师的就业前景 30:34 文科生的春天来了:人工智能时代下的新职业机会 33:43 AI时代的共情能力:文科生的的优势与挑战
- 给大家看的AI绘画教程:如何使用AI来设计炫酷的产品概念图
这周,我的AIGC作品《赛博机甲AIPC笔记本》被比赛主办方联想官方账号转发和点赞了!真是万分荣幸!其实,使用AI绘图工具做产品设计并没有想象中的难。关于如何使用AI设计产品概念图,我专门写了一篇零门槛的教程,希望能够帮助大家参赛拿奖。 学完这篇文章你可以掌握: 1.了解目前有哪些好用的AI绘画平台 2. 学习如何写提示词来设计自己的产品 3.参加AIGC比赛,提升中奖概率 现在,让我们马上步入正题。 一、有哪些可以好用的AI绘画平台? 无论是在线服务还是本地应用,AI绘画工具的多样化和易用性为创意表达打开了新的大门。从初学者到专业艺术家,每个人都可以找到适合自己的工具,将想象力转化为令人惊叹的艺术作品。 在线使用的平台,主要有如下几个: 1. Midjourney (https://www.midjourney.com/) - 特点:极为优秀的AI绘画能力,但需付费使用。 - 是否有免费额度:否。 2. DALL-E (https://labs.openai.com/) - 特点:同样提供顶级的AI绘画服务,属于付费范畴。 - 是否有免费额度:否。 3. Bing (https://www.bing.com/images/create) - 特点:优秀的AI绘画工具,且完全免费。 - 是否有免费额度:有。 4. Leonardo.AI (https://leonardo.ai/) - 特点:提供良好的AI绘画体验,免费使用。 - 是否有免费额度:有。 5. Mage.Space (https://www.mage.space/) - 特点:良好的AI绘画能力,免费且提供多种模型选择。 - 是否有免费额度:有。 6. 百度文心一阁 (https://yige.baidu.com/) - 特点:支持中文 - 是否有免费额度:有。 7. 阿里通义万象 (https://tongyi.aliyun.com/wanxiang/creation) - 特点:支持中文, - 是否有免费额度:有。 总的来说,如果你想要有良好的创作体验Midjourney和DALL-E是最理想选择,其卓越的创作能力是业内公认的。而对于预算有限或希望免费体验AI绘画的用户,可以尝试BingAI的绘画生成能力,因为BingAI绘画接入的就是GPT的DALL-E。另外如果想体验稍微完整的AI绘图能力Leonardo AI也是不错的选择。如果我们受网络所限,百度文心一阁和阿里通义万象也是目前国内用户的选择。如果你更倾向于在本地设备上使用AI绘画工具的用户,首选 Stable Diffusion,主要有Auto11111的WebUI和ComfyUI。另外,还有一些开箱即用的客户端工具,例如,Draw Things和Diffusion Been等。 二、如何撰写AI绘图的提示词? 我们在使用Midjourney、DALL-E、Stable Diffusion等文本生成图像工具的时候,我们需要设计文本提示词(prompts)来指导AI生成图像过程,最终获得我们想要的效果。 我们可以将AI想象为一名正在学画画的中学生,你现在正在扮演一位美术老师,为他布置作业。 我们应该怎么出题呢?下面是一些方法: 1. 需要明确具体: 描述你想要的图像时,尽可能具体和详细,包含场景描述、物体、颜色、情感氛围、风格等。例如,我们出题的时候不说“一辆车”,而是说“一辆红色的跑车在沙滩上”。另外,需要尽量不要有抽象的隐喻,这位学生有可能无法理解。 2. 使用关键词: 使用关键词来描述图像的主要元素,如对象、颜色、环境、气氛,虽然有些比较聪明的学生(如Dell-E和Midjourney V6)已经可以理解完整的句子所表达的语义,但是关键词依然是核心。如果我们通过特定的关键词可以帮助AI更明确的表达,特别是一些艺术风格术语,如“印象派”、“超现实主义”或具体的颜色和纹理描述。 3. 不要过于复杂:虽然要具体,但是过于复杂的提示词可能会使模型难以理解和执行,我们需要找到描述清晰具体但又不过分复杂的平衡点。 4. 渐进式迭代:不用一次到位,我们可以通过实验和调整描述来获得更好的结果。 5. 结构性陈述:好的提示词包含不同方面的描述,如主题、媒介、风格、艺术家、细节、颜色和光照等等,如果我们遵循一定的结构,我们可以写出更明确具体的提示词,帮助这位考生更好地理解你的需求。下面是一个比较常用的提示结构: Prompt = (主体内容) + (环境设定) + (气氛/灯光) + (构图) + (风格参考) 1. 主体内容:一款未来风格的电动汽车。 基础:一款电动汽车。 基础+修饰:一款具有流线型设计的电动汽车。 基础+进一步修饰+画面故事:一款流线型设计的电动汽车,在光滑的公路上高速行驶,车身表面反射着周围的城市光线。 2. 环境:车辆行驶在一条现代化的高架桥上,背景是一个繁华的未来都市,高耸的摩天大楼和光滑的玻璃幕墙反射着夜晚的灯光。 3. 气氛:一种科技感和速度感的结合,展现出未来交通的便捷和高效。 4. 灯光:选择高对比度的照明,强调汽车的轮廓和流线型的设计,同时反映出城市的繁华夜景。 5. 色彩:使用富有科技感的冷色调,如银灰色、深蓝色和白色,以突出未来感和清洁能源的概念。 6. 构图:采用动态的角度,如斜视角或低角度视图,以强调汽车的速度和运动感。 7. 风格参考:参考现代汽车设计和科幻电影中的未来城市景象。 最后,我们将这些描述的关键词整合成一段文本描述: 电动汽车,流线型设计,高速公路,未来城市,夜景,摩天大楼,光滑玻璃外墙,高对比度照明,冷色调,科技感,银灰色,深蓝色,白色,干净能源,动态视角,斜角,低角度视图,现代汽车设计,科幻电影风格。 如果使用国外的平台,我们可以使用翻译软件将提示词变成英文: Electric car, streamlined design, futuristic city, night scene, skyscrapers, smooth glass facades, high-contrast lighting, cold color tones, technology theme, silver-grey, deep blue, white, clean energy, dynamic perspective, oblique angle, low-angle view, modern car design, sci-fi movie style 这里是我在Mage.Space的使用SDXL模型效果如下图: 如果条件有限,你可以尝试国内的平台,像百度文心和阿里通义都支持中文,下面是我这两家平台生成的效果,如果有兴趣可以点击查看大图。 三、如何使用AI进行产品设计? 当我们要做产品设计的时候,我们需要对上面的基本结构拓展: Prompt = (产品功能 + 风格外观 + 材料构造 + 特殊要求 + 设计灵感)+ (环境设定) + (气氛/灯光) + (构图) + (表现风格) 首先,我们的产品主体描述需要更加具体,可以包含面几个维度: 产品功能:描述产品的主要用途或功能。 风格外观:指定设计风格或外观特征。 材料构造:提及所使用的材料或构造方法。 特殊要求:任何特定的设计要求或限制。 设计灵感:参考某些著名产品或设计的风格特征。 另外,我们可以加上一些工业设计常用表现手法:3D渲染风格、CG渲染、手绘、马克笔、彩色铅笔、设计草图等,下面是不同的表现手法。 内容主体: 1. 产品功能:AI强大个人助理笔记本电脑 2. 风格外观:融合《新世纪福音战士》初号机的设计元素,动态棱角设计,霓虹绿和紫色高光 3. 材料构造:光滑金属外壳,带有在不同光线下变色的异彩效果 4. 特殊要求:先进的全息触摸屏技术,3D全息交互 5. 灵感参考:高科技的个人电子设备,科幻电影中的设备,如《银翼杀手》中的未来科技 表现风格:CG渲染、高科技、未来感 环境设定:高科技的未来实验室,多面全息显示屏,浮动的交互式面板,赛博朋克风格的未来城市背景 气氛灯光:神秘的蓝色和紫色背光,营造出高科技和未来感的氛围 构图:高角度俯瞰,笔记本电脑位于中心,周围环绕着先进的设备和充满活力的城市景观 我们得到以下提示词: 未来风格AI强大个人助理笔记本,融合《新世纪福音战士》初号机设计元素,动态棱角设计,霓虹绿紫色高光,光滑金属外壳,异彩变色效果,先进全息触摸屏技术,3D全息交互,高科技未来实验室,多面全息显示屏,浮动交互式面板,赛博朋克风格未来都市背景,神秘蓝紫背光,高科技感,未来感,高角度俯瞰,中心位置笔记本,周围环绕先进设备和动感城市景观 我们可以使用翻译软件将提示词翻译成英文: Futuristic AI-powered personal assistant laptop, integrating design elements from Neon Genesis Evangelion's Unit-01, dynamic angular design, neon green and purple highlights, sleek metal casing with iridescent color-changing effect, advanced holographic touchscreen technology, 3D holographic interaction; set in a high-tech future laboratory with multi-faceted holographic displays, floating interactive panels, against a cyberpunk-style futuristic city background; mysterious blue and purple backlighting, high-tech and futuristic atmosphere; high-angle overview composition with the laptop at the center, surrounded by advanced equipment and a dynamic cityscape 下图OpenAI的DALL-E的生成结果,这是目前表现最到位作品,我们不得不佩服业界顶流的创造力。 这个是Stable diffusion的SDXL模型生成的结果,虽然环境氛围表达到位了,但是缺少创造力。 百度文心和阿里通义万象,效果大家自行评价。 百度文心:https://yige.baidu.com/ 阿里通义万象:https://tongyi.aliyun.com/wanxiang/creation 另外,优秀好的作品介绍也很重要。我们可以使用ChatGPT或百度的文心一言来帮助我们写设计介绍,将这个文字复制给大语言模型: 请扮演一位网络营销高手,帮我写条微博,要求请根据以下产品的描述,从这款作品的作者的角度介绍作品 ``` [这里写上你刚刚在创作过程中使用的Prompt...] ``` 四、参加比赛,准备拿奖 目前,联想正好在做一个AI PC的设计比赛,奖品还不错,而且作品提交次数没有限制,非常适合我们这些掌握AI绘图的普通人参赛。 关于这个活动介绍,请参看我们之前相关的文章:2024年会否进化为 AI PC 产业元年?Mixlab&WebN 喊你来组队比赛, 奖品如下: 一等奖 1 位ThinkPad X1 carbon AI 超级本 2024 二等奖 3 位联想小新 Pro16 AI 超能本 2024 三等奖 10 位 价值 1999 AI 礼包 荣誉奖/最具传播力 5 位 价值 999 AI 礼包 为了更好的帮助大家,我们专门搭建了专门为大赛文生图服务,你也可以尝试通过这个服务来体验文生图的魅力,文末有扫码入群,免费使用: 然后,我们把作品和介绍发到微博或者小红书,记得带上:“#一起联想AIPC#” 并 “@联想中国 ”。 最后,为了提升中奖几率,我们可以把微博地址发群里,让大家一起点赞、评论、转发! 最后,欢迎大家加入我们的比赛互赞群。 如果你有兴趣学习更具有专业性的AI绘画技能,欢迎请加入我和Shadow发起的ComfyUI的知识星球。
- AI时代下的超级个体:与Rui畅聊AI实时互动游戏
上周日,我、Shadow和Rui做了一次在线连麦的直播,背景是Rui在上周发布并开源了一款名为《西游大绘战》的AI实时互动游戏。这款游戏在我们ComfyUI中文社区产生了轰动,许多人都没有想到ComfyUI还能这样玩。 Rui的工作流发布地址:https://openart.ai/workflows/profile/rui400 # 什么是AI实时互动游戏? AI实时互动游戏,主要是以大语言模型为核心驱动,用户通过与游戏实时互动生成具有无限可能性的剧情。AI实时互动游戏不仅限于文字,还可以结合Stable Diffusion图像生成能力,创造一个丰富的多模态游戏世界。 Rui在《西游大绘战》的开发中,利用ComfyUI的节点整合GPT、SD模型和TTS等AI技术,创造了具有独特游戏体验的Workflow(AI工作流)。也再次证明了ComfyUI的灵活性和无限可能性。 他首先利用 GPT 生成每一话的故事文本和选择,同时,将故事文本转换为自然生动语音,增强了玩家的沉浸感。 另外,还通过GPT生成Stable Diffusion的Prompt(提示词),用于创造游戏故事场景对应的画面,使得游戏画面能够根据玩家的选择动态变化。 但将AI技术融合到这种全新游戏设计中也面临了诸多挑战。对于如何处理和控制好AI生成的内容,Rui需要学习大量的跨领域知识,做大量的技术调研,并且还需要像工程师一般不断调试Prompt和参数,才能把控好自动生成的游戏体验。 # AI时代下的“黑客与画家” 在保罗格雷姆的《黑客与画家》书中,提到了黑客与画家的诸多相似性:他们都是伟大的创作者,但伟大的作品并不都是事先严密设计好的,他们为了实现一个创新的灵感,能够反复调试和打磨,他们不会因为困难而退缩,他们总能找到常人不曾想到的解决方案,在作品完成的那一刻就注定了它的杰出和伟大。 面对如此超前和复杂的游戏项目,Rui在《西游大绘战》项目中一个人扮演了一个团队的角色,从策划、设计再到开发制作。但令人惊讶的是,作为一名有十几年游戏原画设计经验的设计师,Rui之前并没有任何编程经验。 今年随着生成式AI的技术崛起,在SD和ComfyUI影响下,游戏行业正在使用AI工作流快速地生成原画设计来提高设计创作的效率,为游戏行业带来了颠覆性的变革。对于很多传统设计师来说这可能是个威胁和挑战,但Rui意识到这是一个转型和探索新领域的机会。他开始研究如何将AI技术融入游戏设计。 Rui制作的Workflow堪称艺术作品,为了达到精细的效果,使用了大量的高级节点和控制流程,将技术与艺术完美地结合在了一起,他最新发布的AI工作流作品“Cute You”,由AI生成的名人卡通形象栩栩如生,又一次引起了ComfyUI创作者们的广泛学习和关注。 Rui是如何掌握这些能力的?他提供了一些学习建议: 首先,他强调了获取信息源的重要性。他建议使用ComfyUI管理器作为了解节点信息的主要入口。并且定期在GitHub搜索ComfyUI相关节点更新。同时关注知名博主和官方博客分享的使用技巧。 其次,深入理解SD的图像生成的流程和原理,这是灵活使用ComfyUI的基础 。对于非程序员,特别是设计师而言,学习ComfyUI是一个跨界挑战,需要改变过去的学习方式,需要多加实践探索 。 另外,要多做实验。开始时不要过于雄心勃勃,因为教程更新也是滞后的,为了防止踩坑我们需要从基础开始,选择小项目,逐步增加复杂性。过程中,我们不要害怕失败,最终我们可以把这些实验经验整合到实际项目中。 最后,加入专业的群和社区,在社区中提问和分享经验是学习的重要部分,这是学习新技能和解决问题的重要方式。在《西游大绘战》的工作流创作过程中,Shadow就给了很大的技术支持,帮助他解决很多自定义节点的问题和需求,这种合作也是一种前所未有的体验。 除了以上四点,我认为Rui的能力,更关键在于他的探索未知的创新精神和不断精益求精的匠人精神。正是因为这些品质,让他编排的每个AI工作流都能成为优秀的作品,兼具科技与审美。也让他成为了黑客与画家的结合体。 在对谈过程中,有社群的小伙伴提到了“超级个体”这个词,我想“黑客与画家”的精神就是AI时代下的超级个体的核心精神。 # 如何成为AI时代的超级个体? 在AI时代下的超级个体都是具有匠人精神的产品经理。他们兼具黑客与画家的品质,追求自由的创作精神和产品理想,能够打破社会分工的枷锁,勇于走出自己的舒适圈,能够不断探索和应用前沿的新技术,打造出一件件让人惊叹的作品。 成为AI时代的超级个体,需要有以下这5个方面的能力: 首先,需要是终身学习者。他们主动追踪技术发展的最新动态,以及这些技术如何应用于不同行业。他们通过自主学习和项目实践,不断增强自己的技术能力和理解力。 其次,需要有很强的跨学科思维。Rui给我们起了一个很好的表率作用,他能够灵活的切换设计师和工程师的思维方式,他将艺术设计与AI技术相结合,创造出独特的游戏体验。超级个体通常能串联不同领域的知识,利用这些交叉点来创新和解决问题。 另外,需要有创新和实验精神。在新兴领域中,不断实验是创新成功的关键。Rui的例子告诉我们,通过熟悉掌握AI工具,即使没有编程背景,也可以通过实验和探索获得实践的成功。这种实验精神,需要我们不畏风险勇于尝试。 还有,就是解决复杂问题的能力。AI技术本身就是解决复杂问题的工具。超级个体需要具备分析复杂系统的能力,并使用AI作为解决方案的一部分。这要求具备良好的逻辑思维能力和系统化思维。 最后,是建立强大的社会链接能力。虽然AI技术强大,但在实际应用中,跨领域的合作是必不可少的。超级个体通过加入社区参与分享和交流,传递更多关于学习方法、行业洞察以及社会发展趋势的思考。通过强化自己的个人品牌,能够获得更多与能力互补的超级个体的合作,拓展出更多职业发展和创作的机遇。 总之,成为AI时代的超级个体,需要我们能够在快速变化的技术环境中,不断学习和成长,同时需要具备创新精神、跨学科思维和强大的问题解决能力。超级个体不仅关注技术实践的本身,还关注技术如何影响行业和社会发展。通过分享和交流,从而获得更加广泛的社会影响力,成为一个标志性的个人品牌。 # 结语 在前天,Rui为了实现自己新的工作流逻辑,在ChatGPT的帮助下编写了一个自定义节点,并提交到了Github开源。地址:https://github.com/rui40000/RUI-Nodes 这是《黑客与画家》精神的最直接体现。也鼓舞了许多在ComfyUI中文社区中不擅编程的设计师。 Rui勇于探索的精神和杰出的创作力,让他打破了传统分工角色的限制。绘画不再是画家的专属,编程也不再是程序员的专属。在AI的帮助下,任何人都可以通过学习和实践,创作自己的杰出作品。 在AI的加持下,超级个体的崛起将打破现有的职业分工体系。它鼓励个体追求创新,拓展知识边界,实现个人和职业成长。他们产生的价值是广泛的行业价值和社会价值。 未来的工作场景中,将会越来越重视跨学科知识和创造性思维。这不仅为超级个体提供了更广阔的发展空间,也为企业和社会带来了更丰富的创新资源。 AI时代,需要我们打破过去那套旧规则,只有拆掉思维里的墙,我们才能获得进化。欢迎加入Mixlab ComfyUI中文社区与大佬们一同成长! 最后,欢迎大家加入ComfyUI的知识星球。
- AIGC产品经理:传统产品经理转型的时代机遇与挑战
今年年初,随着GPT、Midjourney大语言模型的火爆,也带火了AIGC(人工智能生成内容)的潮流。随之而来的是越来越多的AIGC产品经理的招聘需求。AIGC产品经理是一个崭新的角色,同时也面临着一系列独特的挑战和机遇。 到底什么是AIGC产品经理,他和传统的产品经理又有什么不同?就在前几天,我和西坡、小李子对于什么是AIGC产品经理做了一些探讨。(他们都是我的知识星球成员) # 1. AIGC产品经理的独特性 这是某个大厂招聘需求,乍看一下和传统产品经理的招聘需求还是非常相似: 其实,AIGC根据场景和领域不同,对于产品经理的要求也不同。下图绿色的是应用场景,蓝色的部分是每个应用场景对应的模型技术,AIGC产品经理可以根据下图按图索骥地了解相关的技术知识。 西坡作为工作在一线的AIGC产品经理,他首先发表了观点。 虽然AIGC产品经理的工作流程在很大程度上与传统产品经理相似,涵盖需求调研、分析、原型设计等环节,但AIGC产品经理在技术调研和产品功能设计方面的要求更高。这是因为大模型使得产品和研发人员处于同一起跑线。因此,AIGC产品经理需要对技术有更深的理解和洞察能力。 在这一年里,大模型的技术迭代非常快。它需要产品经理很强的自主学习能力,要能够将新的技术能力与具体产品需求相结合。在日常的工作中,西坡除了撰写需求文档之外,也会使用提示工程调试数据,这样才能够将技术能力与产品需求有效结合。同时他每天也会查看大量的前沿动态,并从中发现机会点。 另外,在传统的产品管理和AI项目中,我们管理的是确定性,用户需求是明确的,功能目标是明确的,性能指标也是明确的,在产品需求文档撰写时候就已经解决了80%的不确定性问题,剩下20%是项目执行。 但在AIGC项目中却相反,我们管理的是80%的不确定性。因为用户会把AI当做人来使用,会提任何意想不到问题,但用户都期望AI要能够给出很好的回应。这种不确定性不光是用户带来的,也受数据、模型、提示工程的影响。AIGC产品经理需要能感知到这些不确定性,并让它们控制在用户预期范围内。 很多2C类型的AIGC产品还要求产品经理要有社区产品经验,因为AI内容创作的驱动力还是来源于人,而在线社区是最好的创作者运营方式,在国外Discord社区已经是AIGC产品的标配。因为在AIGC社区里,创作者们可以相互学习和相互激发。而产品经理只有真正理解了这群AIGC创作者才能更好地知道AIGC产品应该怎么做。 因此,在AIGC产品管理中,产品经理更需要近距离地观察用户和亲身体验。因为AIGC产品并没有可以直接可抄袭的功能和交互逻辑,很多问题需要亲身体验才能知道。所以这要求产品经理具有强烈的用户同理心,并能够将自己置入用户的情境中。通过近距离观察和体验,才能更好地理解市场动态和用户行为。 # 2. 快速市场响应与商业能力 在AIGC领域,产品经理面临的主要挑战之一是快速响应市场变化。这不仅要求他们敏锐地捕捉行业趋势和机遇,还要能够进行快速的市场验证。有效的MVP(最小化可行性产品)策略对于确定产品方向和迭代至关重要。 此外,产品经理的商业理解能力也至关重要。在产品设计过程中,必须充分理解商业运作逻辑和实现成本。避免过于复杂和无效的需求设计,确保产品在有限的资源成本下能够有的放矢,步步为营地达到产品与市场的匹配。 在11月7日凌晨,OpenAI举行了一场全球注目的开发者大会,CEO山姆·奥特曼隆重地介绍了GPTs的功能,人人都可以定制自己的GPT助理,还能通过链接分享给朋友。但是目前由于官方GPTs商店还没有上线,许多优秀的GPTs很难被发现。 为此,Mixlab的小伙伴在11月15日还组织了一场名为《GPTs商店,普通人能挣到钱吗?》在线连麦讨论,当我们讨论到是否值得做GPTs精品推荐网站时,西坡认为还是存在一定的机会的,但有另一些朋友表示并不看好这种推荐网站,因为只要官方GPTs商店上线以后,这种网站结局就是昙花一现。 在第二天,西坡的团队就上线了名为“GPTs伙伴”的精品推荐网站(www.gptspt.com),同时西坡启动了社群运营,GPTs创作者和用户开始涌入。社群里的小伙伴都惊呼动作真快。 目前,他们团队只用了一周不到的时间就收集到了四千多个GPTs。一周的时间,对许多大厂团队来说就是给老板写PPT和做汇报的时间。 当我们还在担心官方的GPTs商店即将上线的时候。上周末OpenAI的CEO山姆·奥特曼被戏剧性地驱逐出了公司。这家顶尖的AI公司已变成了一团乱麻。当我们认为接下来GPTs官方商店的项目推进应该会被搁置的时候,在昨天山姆奥特曼又回到了公司。 我给西坡的总结就是“天下武功,唯快不破”。在飞速发展的行业里面,每天都有新变化,反复的犹豫和纠结会让机会转瞬即逝。 对于创业者来说这是一个动态博弈的过程,你能做的就是用最低的成本来验证你的想法,用最快的速度来拿到结果,然后再去迎接下一步挑战,只有快速应变和步步为营,你才更有可能获得成功。 如果你有兴趣可以扫码收听我们上周二的讨论: 3. 产品经理的职业风险与机遇 随着互联网行业增量市场向存量市场的转变,科技公司的运营模式也从资本驱动转变到投资回报率(ROI)驱动,产品经理面也临着全新的挑战。这不仅对企业盈利模式提出了更严格的要求,也对传统分工体系下偏安一隅的产品经理们提出了更高的要求。 项目的ROI和公司财务状况成为决定职位稳定性的关键因素,产品经理需要具有在短期内验证产品的商业价值和潜力的能力,否则自身岗位也岌岌可危。 在这个多变的职业环境中,产品经理应成为斯坦尼斯拉夫斯基的“体验派”。通过亲身体验,深入实际应用场景,亲历市场和产品的起伏变化。这种近距离的观察和体验能够帮助他们理解复杂问题的本质,更透彻地理解市场、用户需求、项目运营和管理。 另外,在职场中,追求财务收益和发展机遇应当不相冲突。产品经理需要明确自己的阶段性职业目标,同时不失对终极理想的追求。只有如此,产品经理才能在不断变化的市场中找到稳固的立足点,并在职业道路上实现持续的成长和成功。 # 结语 AIGC产品经理是一个崭新的岗位,这个岗位的定义也会随着技术飞速发展而更新,产品经理还有很多东西需要学习。 面对技术的复杂性和市场的不断变化,新兴的产品经理们,需要具备深厚的技术理解、敏锐的市场感知、强大的商业能力,以及不断地学习和适应能力。 通过持续的努力和专业发展,AIGC产品经理不仅能够引领产品成功,还能在职业生涯中取得显著成就。 如果你是传统产品经理,这也是一次难得的职业转型的机会。如果你已经跃跃欲试,请迈开你的第一步,学会使用ChatGPT,构建自己的GPTs,并把他们带到自己的工作和生活中。 你可以尝试一下我构建的“高级产品管理专家”GPT,它除了能帮助你处理日常的产品管理工作外,也会告诉你AIGC产品经理需要掌握哪些技能。希望它能够更好的帮助到你,访问地址:https://chat.openai.com/g/g-amlOc6xcY-gao-ji-chan-pin-guan-li-zhuan-jia 在后续内容中,我会告诉大家如何构建属于自己专业领域GPTs,你可以给我留言你的问题。 最近,我们正在组建ComfyUI中文社区,如果你还不了解什么是ComfyUI,请查看我的上一篇文章《AIGC工作流: 新时代产品经理和创业者的秘密武器》。目前群已经加满,后台回复我“ComfyUI入群”。 另外,我们正在与Openart.com招募更多优秀的ComfyUI工作流创作者,详情请查看文章《ComfyUI工作流:AI创作者的新名片#OpenArt联手Mixlab、ComfyUI中文社区》 关于AIGC产品经理的更多内容和资料可以关注我的星球。
- 比尔·盖茨:AI代理人将彻底改变人们使用电脑的方式
翻到Shownotes的最底部有价值128元的福利可以免费领取。 这是一篇比尔·盖茨在最近写的文章,主要强调了人工智能技术的未来潜力和影响。他认为AI将深刻改变我们的生活方式,特别是通过高级AI助手(或称之为代理),这些代理能够理解复杂的请求并执行多种任务。他强调了AI在提高效率、解决复杂问题以及改善人类生活质量方面的巨大潜力。同时,他也提到了随之而来的挑战,如数据隐私、安全性和伦理问题。总的来说,盖茨对AI技术的未来持乐观态度,同时也认识到需要解决的关键问题。 00:10 即使到了今天,我对软件的热爱仍与当年我和保罗·艾伦一起创立微软时一样浓烈。但即便在这些年间软件有了很大的进步,从很多方面来说,软件仍然相当“愚蠢”。 要在电脑上完成任何任务,你必须告诉你的设备使用哪个应用程序。你可以使用微软Word和谷歌文档来起草商业提案,但它们无法帮助你发送电子邮件、分享自拍、分析数据、安排聚会或购买电影票。即使是最好的网站也对你的工作、个人生活、兴趣和人际关系理解有限,而且在使用这些信息为你服务方面能力有限。这种事情在今天只有通过另一个人,比如一个亲密的朋友或个人助理,才能实现。 在未来五年内,这一切将完全改变。你不需要为不同的任务使用不同的应用程序。你只需用日常语言告诉你的设备你想做什么。根据你选择与它分享多少信息,软件将能够做出个性化响应,因为它将对你的生活有着丰富的理解。在不久的将来,任何在线的人都将能够拥有一个由人工智能驱动的个人助理,其能力远远超出今天的技术。 这种类型的软件——能够响应自然语言并根据对用户的了解完成许多不同任务的软件——被称为“代理”。我已经思考代理近30年,并在我的1995年的书《未来之路》中写到了它们,但直到最近因为人工智能的进步,它们才变得实用。 代理不仅将改变每个人与电脑互动的方式。它们还将颠覆软件行业,带来自我们从键入命令到点击图标以来计算机领域最大的革命。 每个人的私人助理 一些批评家指出,软件公司以前提供过类似的东西,但用户并没有真正接受它们。(人们仍然在拿微软Office中曾经包含后来又放弃的数字助手Clippy开玩笑。)为什么人们会使用代理? 答案是它们会好得多。你将能够与它们进行微妙的对话。它们将更加个性化,并且不仅限于相对简单的任务,如写信。Clippy与代理的共同之处,就像旋转电话与移动设备的共同之处一样。 如果你愿意,代理将能够帮助你处理所有活动。通过允许它跟踪你的在线互动和现实世界的位置,它将对你参与的人、地点和活动有强大的了解。它将了解你的个人和工作关系、爱好、偏好和日程。你将选择它何时介入帮助某事或要求你做出决定。于下午 13:40 的时候发布了一些关于 为了看到代理将带来的巨大变化,让我们将它们与今天的AI工具进行比较。这些工具大多是机器人。它们限于一个应用程序,并且通常只在你写下特定单词或寻求帮助时介入。因为它们不记得你上一次如何使用它们,所以它们不会变得更好或学习你的任何偏好。Clippy是一个机器人,而不是一个代理。 代理更聪明。它们是主动的——能够在你提出要求之前就提出建议。它们能够跨应用程序完成任务。它们会随着时间的推移而改进,因为它们记住了你的活动,并识别出你行为中的意图和模式。基于这些信息,它们会提供它们认为你需要的东西,尽管最终决定权始终在你手中。 想象一下你想要计划一次旅行。一个旅行机器人会识别出符合你预算的酒店。而一个代理则会知道你将在哪个季节旅行,并根据它对你是总是尝试新目的地还是喜欢重复访问同一个地方的了解,它将能够提出地点建议。当被问及时,它将根据你的兴趣和冒险倾向推荐活动,并在你喜欢的餐厅预订位置。如果你想要今天这种深度个性化的规划,你需要支付旅行代理费用并花时间告诉他们你想要什么。 AI代理最令人兴奋的影响是它们将使今天对大多数人来说太昂贵的服务民主化。它们将在四个领域产生特别大的影响:医疗保健、教育、生产力以及娱乐和购物。 医疗保健 今天,AI在医疗保健中的主要作用是帮助处理行政任务。例如,Abridge、Nuance DAX和Nabla Copilot可以在预约期间捕获音频,然后为医生撰写笔记。 真正的转变将在代理能够帮助患者进行基本分诊、获取如何处理健康问题的建议以及决定他们是否需要寻求治疗时发生。这些代理还将帮助医疗工作者做出决策并提高生产力。(已经有像Glass Health这样的应用程序可以分析患者摘要并为医生提出诊断建议。)帮助患者和医疗工作者将特别有益于那些在贫穷国家的人们,因为那里许多人根本就看不到医生。 这些临床代理的推出将比其他代理慢,因为做对事情是生死攸关的。人们需要看到证据表明健康代理总体上是有益的,即使它们不会完美并且会犯错误。当然,人类也会犯错误,而且没有获得医疗保健也是一个问题。 心理健康护理是另一个代理将使之几乎对每个人都可用的服务的例子。今天,每周进行一次治疗会话似乎是一种奢侈。但存在大量未满足的需求,许多需要治疗的人无法获得它。例如,兰德公司发现,所有需要心理健康护理的美国军事退伍军人中有一半没有得到治疗。 在心理健康方面受过良好训练的AI代理将使治疗更加负担得起且更容易获得。Wysa和Youper是这里的早期聊天机器人。但代理将走得更深。如果你选择与心理健康代理分享足够的信息,它将了解你的生活历史和你的人际关系。它将在你需要时随时可用,并且永远不会变得不耐烦。它甚至可以在你的允许下,通过你的智能手表监测你对治疗的生理反应——比如当你谈论与老板的问题时心跳加速——并建议你何时应该看人类治疗师。 教育 几十年来,我一直对软件将如何使教师的工作变得更轻松并帮助学生学习感到兴奋。它不会取代教师,但它将补充他们的工作——为学生个性化工作并解放教师免于文书工作和其他任务,以便他们可以花更多时间在工作的最重要部分上。这些变化终于开始以戏剧性的方式发生。 目前的最先进技术是由可汗学院创建的基于文本的机器人Khanmigo。它可以在数学、科学和人文学科中辅导学生——例如,它可以解释二次公式并创建数学问题供练习。它还可以帮助教师完成如编写课程计划等任务。我长期以来一直是Sal Khan的工作的粉丝和支持者,并最近在我的播客上邀请他谈论教育和AI。 但基于文本的机器人只是第一波——代理将开启更多学习机会。 例如,很少有家庭能支付一对一辅导学生以补充课堂学习的家教费用。如果代理能够捕捉到使家教有效的因素,它们将为每个需要的人解锁这种补充教学。如果一个辅导代理知道一个孩子喜欢Minecraft和泰勒·斯威夫特,它将使用Minecraft教他们计算形状的体积和面积,使用泰勒的歌词教他们讲故事和押韵。与今天的基于文本的辅导相比,体验将更丰富——例如,具有图形和声音——并且更加个性化。 生产力 这个领域已经有很多竞争。微软正在将其Copilot作为Word、Excel、Outlook和其他服务的一部分。谷歌也在用Assistant、Bard和其生产力工具做类似的事情。这些副驾驶可以做很多事情——比如将书面文件转换成幻灯片,使用自然语言回答有关电子表格的问题,并在代表每个人的观点时总结电子邮件线索。 代理将做得更多。拥有一个代理就像拥有一个专门帮助你完成各种任务并在你愿意的情况下独立完成它们的人。如果你有一个商业想法,代理将帮助你撰写商业计划,为其创建演示文稿,甚至生成你的产品可能的外观图像。公司将能够使代理直接为其员工提供咨询,并成为每次会议的一部分,以便它们可以回答问题。 无论你是否在办公室工作,你的代理都将能够以与今天个人助理支持高管相同的方式帮助你。如果你的朋友刚做了手术,你的代理将提议发送鲜花,并能为你订购。如果你告诉它你想要与你的大学室友联系,它将与他们的代理合作找到见面的时间,并在你到达之前提醒你,他们的大孩子刚刚开始在当地大学上大学。 娱乐和购物 AI已经可以帮助你挑选一台新电视并推荐电影、书籍、节目和播客。同样,我投资的一家公司最近推出了Pix,它允许你提问(“我会喜欢哪些罗伯特·雷德福的电影,我在哪里可以看?”),然后根据你过去喜欢的内容做出推荐。Spotify有一个AI驱动的DJ,不仅根据你的偏好播放歌曲,还会与你交谈,甚至可以叫你的名字。 代理不仅会提出建议;它们还会帮助你采取行动。如果你想买相机,你将让你的代理为你阅读所有评论,总结它们,提出建议,并在你做出决定后下订单。如果你告诉你的代理你想看《星球大战》,它会知道你是否订阅了正确的流媒体服务,如果没有,它会提议帮你注册。如果你不知道你想看什么,它会提出定制化建议,然后找出如何播放你选择的电影或节目。 你还将能够获得根据你的兴趣量身定制的新闻和娱乐。CurioAI,它可以根据你询问的任何主题创建定制播客,是即将到来的东西的一瞥。 科技行业的震荡波 总之,代理将能够帮助几乎任何活动和生活的任何领域。它们对软件业务和社会的影响将是深远的。 在计算行业,我们谈论平台——应用程序和服务构建在其上的技术。Android、iOS和Windows都是平台。代理将是下一个平台。 要创建一个新的应用程序或服务,你不需要知道如何编写代码或进行图形设计。你只需告诉你的代理你想要什么。它将能够编写代码,设计应用程序的外观和感觉,创建一个logo,并将应用程序发布到在线商店。OpenAI本周推出的GPTs为非开发者可以轻松创建和分享他们自己的助手的未来提供了一个窥视。代理将影响我们使用软件的方式以及软件的编写方式。 它们将取搜索网站,因为它们在为你找到信息并为你总结它方面会更加出色。它们将取代许多电子商务网站,因为它们会为你找到最佳价格,并且不会仅限于几个供应商。它们将取代文字处理器、电子表格和其他生产力应用程序。今天是独立的业务——搜索广告、带广告的社交网络、购物、生产力软件——将成为一个业务。 我不认为任何单一公司将主导代理业务——将有许多不同的AI引擎可用。今天,代理嵌入在其他软件中,如文字处理器和电子表格,但最终它们将独立运行。尽管一些代理将免费使用(并通过广告支持),但我认为你将为大多数代理付费,这意味着公司将有动力使代理为你的利益工作,而不是广告商的利益。如果今年开始从事AI工作的公司数量有任何迹象,那么将会有异常多的竞争,这将使代理非常便宜。 但在我所描述的复杂代理成为现实之前,我们需要面对关于技术及其使用方式的许多问题。我之前已经写过AI引发的问题,所以我将在这里专门关注代理。 技术挑战 目前还没有人弄清楚代理的数据结构将是什么样的。为了创建个人代理,我们需要一种新型数据库,能够捕捉你的兴趣和关系的所有细微差别,并在保持你隐私的同时快速回忆信息。我们已经看到了存储机器学习模型生成的数据的新方法,例如向量数据库,这可能更适合存储数据。 另一个悬而未决的问题是人们将与多少代理互动。你的个人代理是否与你的治疗师代理和你的数学家教代理分开?如果是这样,你什么时候希望它们相互合作,什么时候应该保持各自的领域? 你将如何与你的代理互动?公司正在探索各种选项,包括应用程序、眼镜、吊坠、别针,甚至全息图。所有这些都是可能性,但我认为人类与代理互动的第一个重大突破将是耳机。如果你的代理需要与你联系,它将对你说话或在你的手机上显示。(“你的航班延误了。你想等待,还是我可以帮你重新预订?”)如果你愿意,它将监控进入你耳朵的声音,并通过阻挡背景噪音、放大难以听到的语音或使听起来带有浓重口音的人更容易理解来增强它。 还有其他挑战。目前还没有一个标准协议,允许代理相互通信。成本需要降低,以便代理对每个人都负担得起。需要更容易地提示代理,以便为你提供正确的答案。我们需要防止幻觉,特别是在像健康这样的领域,准确性非常重要,并确保代理不会因其偏见而伤害人们。我们不希望代理能够做它们不应该做的事情。(尽管我对流氓代理的担忧比对使用代理进行恶意目的的人类犯罪分子的担忧要少。) 隐私和其他重大问题 随着所有这些事情的发展,在线隐私和安全问题将变得比现在更加紧迫。你将希望能够决定代理可以访问哪些信息,以便你有信心你的数据只与你选择的人和公司共享。 但是你与代理共享的数据归谁所有,你如何确保它被适当使用?没有人希望开始收到与他们告诉治疗师代理有关的广告。执法部门可以使用你的代理作为对你不利的证据吗?你的代理何时会拒绝做可能对你或他人有害的事情?谁来选择内置于代理中的价值观? 还有一个问题是你的代理应该分享多少信息。假设你想见一个朋友:如果你的代理与他们的代理交谈,你不希望它说,“哦,她周二要见其他朋友,不想让你加入。”如果你的代理帮你写工作电子邮件,它将需要知道不应该使用关于你的个人信息或你以前工作专有数据。 这些问题已经成为科技行业和立法者的首要关注点。我最近参加了由参议员查克·舒默组织的一次AI论坛,与其他技术领袖一起,许多美国参议员也参加了此次论坛。我们分享了关于这些和其他问题的想法,并讨论了立法者采纳强有力的立法的必要性。 但是,其他问题不会由公司和政府决定。例如,代理可能会影响我们与朋友和家人的互动方式。今天,你可以通过记住他们生活中的细节——比如他们的生日——来向某人表达你对他们的关心。但当他们知道你的代理可能提醒了你这件事并负责发送鲜花时,这对他们来说是否还有意义? 在遥远的未来,代理甚至可能迫使人类面对关于目的的深刻问题。想象一下,代理变得如此出色,以至于每个人都可以在几乎不用工作的情况下拥有高质量的生活。在这样的未来,人们会如何利用他们的时间?当代理拥有所有答案时,还有人会想要接受教育吗?当大多数人都有大量空闲时间时,你能拥有一个安全繁荣的社会吗? 但我们距离那个时刻还很遥远。与此同时,代理即将到来。在接下来的几年里,它们将彻底改变我们的生活方式,无论是在线上还是线下。 [原文完] 观点 人工智能的发展正处于一个关键的十字路口。一方面,AI展现出了巨大的潜力,能够在教育、医疗保健、环境保护等多个领域带来革命性的改变。它有可能极大地提高生活质量,解决一些长期以来人类难以克服的问题。 然而,另一方面,这种技术的快速发展也带来了一系列复杂的伦理、隐私和安全问题。数据的控制权、AI决策过程的透明度,以及其对就业和社会结构的影响,都是我们必须认真对待的问题。特别是在AI技术可能加剧社会不平等的情况下,我们需要谨慎行事,确保技术进步能够惠及所有人。 此外,我也认为人工智能的发展不应仅仅被视为技术进步的问题,而应该是一个更广泛的社会、文化和伦理议题。我们需要跨学科的合作,包括技术专家、社会学家、伦理学家和政策制定者,共同探讨和制定相应的法律法规,以确保AI技术的健康发展。 最后,我对人工智能未来的发展持谨慎乐观的态度。我相信,通过全人类的合作和负责任的创新,我们可以利用AI的潜力来改善人类的生活,同时有效地应对其带来的挑战。 福利:北京虎嗅F&M创新节价值125元的门票,关注PM熊叔公众号可以免费领取:微信后台私信我获得兑换密码,即可免费领取。
- AIGC工作流:新时代产品经理和创业者的秘密武器
在我过去的文章里有说过,产品经理是“帮助团队交付正确产品给用户的人”。从客户需求挖掘到最后产品使用体验,产品经理要确保产品价值能够端到端地传递给用户,产品经理需打破团队成员的分工壁垒,这考验着产品经理综合能力和素质,这也是产品经理的领导力的体现。 如今,随着ChatGPT、Midjourney、StableDiffusion等生成模型带动起来的热潮,AI大模型正逐渐渗透到各种产品和服务中,越来越多的产品经理也在考虑将AIGC(AI生成内容)能力融入到自己的产品中,然而这并非易事,在项目实践的过程中产品经理面临着诸多的挑战和困惑…… # 一、AIGC的产品管理挑战 在传统的互联网产品的开发流程中,产品原型图是不可或缺的工具。产品经理或交互设计师通常会使用Axure、Sketch或Figma等工具,投入主要的时间绘制线框图,并通过页面流程图来阐释产品的交互逻辑。通过这种方法,团队成员能直观地理解产品的最终呈现效果,方便地讨论问题并形成共识,从而保证最终交付的产品体验与预期保持一致。这是过去十几年来,互联网和软件行业一直奉行的最佳实践。 然而在AIGC产品中,用户更关心的是AIGC的数据体验,而不是界面的交互体验,传统的体验设计范式已经不再适用。例如,著名图片生成工具Midjourney以对话机器人的形式呈现,用户只要在Discord中和它对话就能获得高质量的图片,因为Midjourney很清楚地知道:用户更关心的是我们能不能根据提示词生成优质的图片,而不是别的什么东西。 题外话:“知道自己应该做什么,并把它做到极致”——正因如此才让这只有十几人的小团队能完成1亿美元的年营收。这是我们每一个创业者和产品经理都需要学习的能力。 因为AIGC产品体验的重心已从界面转向了数据。由于许多产品经理对数据和AI算法了解不足,让他们在技术沟通上遇到了极大的挫败感,而且传统的原型设计工具在应对AI产品时也显得力不从心,无法保证最终的交付效果和预期的一致性。对于一些想应用AIGC能力的产品经理而言,不仅AI模型是个不可解释的黑盒,连AI产品的研发过程也变成了一个不可知的黑盒。 正所谓“拿着旧地图无法抵达新大陆”,在新时代,我们应该放弃旧的思维方式拥抱新的工具和新方法。 # 二、AIGC工作流(Workflow) Stable Diffusion,作为一款广受欢迎的图片生成的开源项目,为AIGC内容创作者提供了强大的助力。ComfyUI进一步拓宽了Stable Diffusion的创作可能性。ComfyUI通过节点流程的界面设计,让用户可以轻松拖拽、连接不同的模型、模块和参数,形成高度定制和可复用的Workflow(AIGC工作流),而用户无需编写任何代码。它可以帮助我们实现更加丰富和定制化的数据体验。 另外,ComfyUI还有以下优势: 易于共享与协作:支持工作流的导出和分享,不仅加速了项目开发,也为团队间的学习和交流创造了条件。 良好的性能优化:其内存管理和按需加载机制确保在资源受限的环境下,仍能加载大模型生成高质量图像。 可扩展性:用户可以轻松添加自定义节点、插件和模型,社区已贡献了200多个自定义节点,为工作流的设计和优化提供了丰富的选择。 ComfyUI本质上是AIGC的Pipeline(数据处理管道)的可视化构建工具,它将Stable Diffusion的运行机制显性化的展示在我们面前。在图形生成的过程中,ComfyUI能够实时为我们呈现数据处理的过程。让我们在设计和调试的时候,可以快速定位和解决问题。 ComfyUI不仅仅是让AIGC创作者可以更自由地创作,它的流程逻辑的可视化、可复用以及数据的实时可验证,不就等同于产品原型构建工具么? 在产品融图、营销海报和视频素材等应用场景中,AIGC正在发挥极大的价值。目前,一些前沿的团队已经在使用ComfyUI改进他们的工作方式,产品经理将ComfyUI作为产品原型设计工具,深度参与到模型训练和AIGC工作流的构建中,然后再交由开发人员和算法工程师进一步优化,最后转化成可稳定运行的Pipeline部署到正式环境中。 通过ComfyUI的可视化节点式工作流,产品经理和开发团队的沟通与协作得到了促进,使项目团队能在早期快速搭建和验证项目原型,缩短开发周期,降低试错成本,确保产品需求和体验目标的一致性,从而更好地实现端到端的产品体验目标。 # 三、UE蓝图系统的启示 拖拽式的节点编程并不是ComfyUI的独创,例如,Blender、Maya和Unreal Engine(虚幻引擎)也提供了类似的功能。 虚幻引擎的蓝图系统通过提供丰富的节点库和强大的可视化编程环境,使用户能够在无需编写代码的情况下构建复杂的游戏逻辑。 蓝图系统的高度可定制性和扩展性,允许用户创建自定义节点,甚至可以与传统的编程代码无缝集成,直接打包成跨平台的游戏,不仅为游戏开发提供了强大而灵活的解决方案,也缩短了从概念到可交付产品的时间周期。这种方式使游戏设计师、艺术家和小型工作室能快速地制作出可运行的游戏产品,极大地丰富了游戏创意的表达。 得益于虚幻引擎的强大表现力和无需编程的创作方式,使得其他行业的专家也可以使用虚幻引擎来实现想法。这也让其成为一款贯通各行各业的三维拟真创作工具,从游戏行业跨足至建筑设计、工业设计、城市规划和厂房规划等众多领域。 可视化的节点编程和模块化设计极大地降低了编程门槛,促进了不同背景的团队间的协作和交流,吸引了来自更多不同领域的创作者共同丰富产品应用场景和生态。 这也为ComfyUI提供了启示:强大的可视化和模块化能力不仅降低了产品开发和发布的门槛,还拓宽了创意和协作的空间,使得想法可以快速转化为实际可交付的产品成为可能,从而更好地满足不同用户和市场的需求。这就是“引擎”的魅力。 # 四、展望未来 目前,得益于ComfyUI的自定义节点的可扩展性,已有开发者创建了ChatGPT节点,为图像生成工作流赋予了大语言模型的思考能力,能快速生成提示词,可以方便快速创作大量的内容。如下图所示: 展望未来,随着ComfyUI自定义节点的丰富化,它将不仅局限于Stable Diffusion的图像生成能力,而会整合更多领域的AI模型,逐渐成为一个多模态的AIGC产品构建工具。未来也可能会出现类似虚幻引擎的多模态AI引擎平台,能直接将AIGC工作流打包成高可用和可交付的产品。 另外,由于企业级项目对硬件资源有较高要求,ComfyUI主要部署在团队的云端服务器上,这也将催生团队在线协同的需求,为创业者提供新的机会。我相信未来的ComfyUI在线版本可能会借鉴Figma的在线协同功能,让团队成员能共同参与AIGC工作流的搭建,为AIGC产品开发带来前所未有的在线协作体验。 # 结语 十年前,许多产品经理通过学习《网站蓝图:Axure RP高保真网页原型制作》这本书,步入了互联网产品领域。然而,在AIGC产品领域,Axure已无法满足现今的需求。 正如“拿着旧地图无法抵达新大陆”一样,当我们拿着旧“蓝图”时也难以创造新产品。现在,AIGC工作流已成为我们需要学习和掌握的新“蓝图”的能力。 通过学习和应用ComfyUI,产品经理和创业者能更深入地理解AI原理和工作方式,获得更为顺畅技术沟通能力。同时,通过快速构建和验证AI模型,我们可以确保产品需求与体验的一致性,大幅缩短产品开发周期。 掌握ComfyUI的AIGC工作流,产品经理和创业者不仅能自信应对AI产品开发的挑战,还能探索和实现创新的产品设计,树立在AIGC领域的领导力。 AIGC掀起的热潮也仅仅只有半年多的时间,技术正飞速发展和迭代,新事物层出不穷,在这个行业没有多年经验的老师傅。不管你是创业者还是产品经理,如果想转行到AIGC领域,现在是学习的最佳时机,只要学习的速度够快,你就可能成为该领域的专家。通过掌握ComfyUI,你能为未来的职业发展和团队协作打下坚实的基础,更好地适应这个行业的发展和需求。 欢迎对AIGC工作流感兴趣的小伙伴一起同行! 目前,我们正在翻译ComfyUI官方文档和撰写入门教程,网址:https://www.mixcomfy.com 同时,我们正在搭建ComfyUI中文社区,如果你对ComfyUI感兴趣可以扫码加入。 ComfyUI爱好者群: 另外,如果你想深入学习ComfyUI动画等相关知识可以加入这个知识星球,是Shadow和我联合发起的,我们收集和整理全网最新最完整的资料。 早期用户优惠,满50人后开始涨价
- 春江水暖鸭先知:洞悉AIGC技术趋势,把握内容产业变革的先机
今年4月份,我参加了上海的AIGC(人工智能生成内容)创建者大会,当时对于趋势做了一些分享。具体可以参看文章《AIGC革命:拐点降临的内容产业,如何赢得时代先机》。 山雨欲来风满楼,将近半年过去了,现在趋势又会有怎么样的变化?技术迭代又给我们带来怎样的机遇? # 一、公理 如今,抖音、快手、微信视频号等短视频平台迅速崛起,短视频和推荐算法构建的信息茧房,已让许多人无法释手、难以自拔。 互联网行业有个普遍的共识:“视频的价值远超过图文和音频”。因为视频能在单位时间内传递更多维度的信息,这不仅带来了丰富的感官体验,还更容易建立情感纽带,从而实现较高参与度、较强社交传播力和更高的商业转化。如Youtube的贴片广告的变现价值和哔哩哔哩的弹幕的互动价值都是传统的图文和音频内容无法比拟的。 基于此,我们可以得出第一条公理:“在单位时间内,高信息密度内容的价值要远大于低信息密度内容的价值”。 然而,互联网视频内容的普及并非一蹴而就,2007年,我国网民数量是1.62亿,互联网的普及率只有12.3%。到了2023年,我国网民规模达10.79亿人,互联网普及率达76.4%,移动互联网人群成为了主力。 正如每一次量子跃迁都会释放出巨大的能量,新兴技术的普及也会带来巨大的红利。随着移动网络和智能手机的性能提升和普及,PC互联网时代跃迁至移动互联网时代,释放了巨大的增量市场,也孕育了新的内容创作和消费场景。 在PC互联网时代,由于网络环境和设备的限制,主要人群局限在日常使用电脑的学生和白领,UGC(用户生产内容)主要是图文形式,如人人网、天涯论坛、新浪博客和微博等。由于视频内容较高的制作门槛,更多是由专业人士通过PGC(专业生产内容)形式生产。 今天,普通人通过一台手机就可以随时随地制作视频和分享内容。如此低门槛的方式,引发了UGC内容爆发性增长。同时,移动社交网络兴起也为内容传播提供了新的平台,进一步推动了视频内容消费的频次和多样性。 正所谓:“旧时王谢堂前燕,飞入寻常百姓家”。正是因为PC互联网到移动互联网的变革,催生了从PGC到UGC转变,带来了今天内容产业的繁荣。 由此,我们可以得出第二条公理:“技术革新的普及大大降低了普通人的内容创作和消费的门槛,从而释放出巨大的市场增量价值。” 如今,强大的生成式AI让我们又一次站在了重塑内容产业格局的风口浪尖。ChatGPT、Midjourney、DALL-E、Stable Diffusion等生成式的AI大模型不断推陈出新,AI新应用也让人应接不暇。 当我们理解“内容信息密度”和“技术革新普及率”这两条公理之后,我们才能更好地去洞察这一切的变化,才能见微知著地做好趋势的判断。 # 二、洞察 随着Midjourney、Stable Diffusion技术的普及,制作AIGC图片已经成为众多创作者们兴趣爱好。但现在仅靠生成“1girl”的静态图像已不能满足日益增长的创作需求。在Stable Diffusion生态里,新的方法、论文和模型如雨后春笋般不断出现,AIGC的创作方式也在快速进化。 我们洞察到了几个新趋势:首先是以ComfyUI为代表的AIGC工作流程的革新,它为个性化创作内容带来了前所未有的便捷;其次,AnimateDiff引领的动画生成展现了动态内容创作的无限可能;最后,DreamGaussian所展现的3D内容生成正开辟着全新的视觉艺术领域。这些趋势预示着一个更加繁荣和多元的AIGC时代即将到来,同时也将带来更多的机遇。 1. AIGC工作流革命 在Stable Diffusion项目中,目前普遍流行的WebUI,如Automatic 1111,因其缺乏灵活性,让普通用户难以根据自己的想法构建完整的创作流程,也限制了用户对新方法和新模型的尝试。 新推出的ComfyUI正在改变这一切。它允许用户通过拖拽节点和连线的方式,将不同的模型、算法和参数组合在一起,形成一套自己的工作流,从而编织出更有创造力的AIGC内容。 这意味着,即使是无编程背景的用户,也能够高度灵活和个性化地使用Stable Diffusion进行创作。ComfyUI按需加载模块的设计方式,在保证灵活性的同时,也大大减轻了系统资源的消耗,让装有中低端显卡的电脑也能顺利运行。 AIGC的创意很重要,但AIGC工作流更具价值,因为这才是人类创造力的真正体现。让人惊喜的是ComfyUI还可以通过PNG图片共享完整的工作流信息。也就是说,用户不仅可以创造多彩的作品,还可以非常轻松地分享他们的创作流。这直接促进了优秀的AIGC工作流技巧在社区普及和传播,也将带来更多具有创意性内容。 ComfyUI不仅为Stable Diffusion带来了更高级的创作体验,它还为我们揭示了AIGC工作流的巨大潜力,预示着我们正步入一个更高效、更具共享性和创新性的AIGC创作新阶段。 Shadow最近也在做ComfyUI的课程,大家可以看看效果:ComfyUI的视频工作流 2. AIGC动画即将崛起 因为创作者不满足于2D静态图像的生成,AnimateDiff应运而生,其目标是将Stable Diffusion的静态图片生成能力扩展到动画生成领域。这一工具可以无缝将文本或静态图像转化为高质量的个性化动画图像,免去了复杂的模型微调。 AnimateDiff之所以卓越,是因为它从大量视频中汲取了动作的先验知识,不仅确保了动画的流畅性、一致性和多样性,还能实现无可比拟的平滑过渡,几乎没有任何闪烁。下面是我前几天视频号分享的内容,在24小时内获得大量转发和观看。 AIGC动画的优势在于其更高的自由度和容错性。创作者可以释放无限创意,打造出超越现实的艺术品。而且,它改变了传统动画对专业技能和资源的依赖,使非专业用户也能轻松参与。 这不仅是技术的巨大进步,更标志着创意表达方式的革新。现在,每个人都有机会成为宫崎骏,创作出令人惊叹的动画作品。这是Shadow做的一个童话故事的实验,故事和gif动画都由AI生成的,请查看时间是主观的,每个人对时间的感受都不同 AIGC正从图片领域跃迁到视频领域,预示着新的内容创作浪潮的即将到来。就像我前几天在视频号分享的动画短片,利用AIGC技术,创作者不仅能吸引更多观众,还能获得视频的巨大流量和商业价值。这在传统图文媒介中是难以实现的,这是所有内容创作者都不应忽视的机遇。 3. AIGC从平面走向立体 同样因为不满足于2D图像生成,也有不少AIGC创作者也在探索如何将2D图像转化为3D形象和场景,因为3D有着比2D更高的灵活性和操控性。然而,传统的文字或图像生成3D算法耗时长、精度低,这严重阻碍了AIGC在3D领域的深入应用。 最近DreamGaussian横空出世,它实现了一种高效的文本和图片生成3D算法。它可以在短短两分钟内,从单一视角的图片中重建出高质量的纹理3D网格,其效率是现有技术的十倍之多。更难能可贵的是,尽管处理速度极快,但它在输出模型的质量上却毫不妥协,下图是老算法和新算法的渲染效率比较。 DreamGaussian通过采用创新的3D高斯喷洒技术,在虚拟空间中模拟粒子的自然运动,可以精确地构建3D模型。这种技术不只是还原物体的几何形状,还能捕捉其表面的细微纹理和色彩,展现了惊人的细节和还原度。该技术虽已展现出强大的潜力,但它的旅程才刚刚开始,在效率、精度和应用场景上仍然有一定的优化的空间。 通过与Stable Diffusion结合,DreamGaussian使内容创作者能够以前所未有的速度和创造力生产出高品质的模型,从而极大地加快了创作流程。更重要的是,3D内容生成技术将为各行各业开辟了新的应用路径。无论是电影和游戏产业的快速内容创建,还是产品设计和建筑领域的可视化原型设计。AIGC 3D将优化现有工作流程,降低成本并激发新的创意表达形式。 相信不久的将来,内容消费者能够在内容平台看到越来越多的AIGC 3D视频内容,能够在VR和AR体验中享受到更逼真、高质量的3D环境,实现前所未有的沉浸式体验和交互性。随着这一技术的不断成熟,我们预见一个更加丰富、精细、互动性强的元宇宙即将到来。 # 三、机遇 AIGC依然在飞速发展,正所谓“春江水暖鸭先知”,一线的AIGC创作者们已经敏锐地感知到这些趋势变化。AIGC的工作流程优化和内容形式迭代,正为创作者、投资人和创业者打开一片新天地。具体的产业机遇主要集中在以下几个方面: 1. 内容创作新浪潮: AIGC技术正在降低内容创作的技术门槛,使个人创作者和小型工作室能够更加容易地打造出具有差异化和个性化的内容。即便是没有深厚艺术背景的创作者也能制作出专业级的动画,满足市场对高质量、多样化内容的渴望。 2. 广告与营销的革新: 在广告和营销领域,AIGC允许品牌以前所未有的方式创作个性化内容,并快速产出高质量的广告素材。目前,一些知名品牌已经在使用AIGC打造创意广告,通过打造更为生动、引人入胜的广告形式,获得市场的关注。 3. 娱乐内容的多元化: AIGC正将娱乐体验推向一个全新的境界,尤其是在直播互动、游戏以及VR/AR等领域。目前,游戏产业正在使用AIGC快速生成游戏环境和角色,为玩家提供更丰富、更沉浸式的体验。 4. AIGC教育培训需求: AIGC技术的崛起不仅改变了传统的内容制作流程,也为CG教育带来了革命性的变化。如何精通并利用AIGC技术创作出更多更优质的内容成了每个创作者的必修课,已经有越来越多的教育机构开始提供AIGC的相关课程。 5. 算法和算力的需求: AIGC内容创作的复杂性和精细化需求的提升,也产生了算法和算力的迫切需求。创作者和工作室等小型创作群体,也要应对能耗和硬件成本的快速上升,这也将催生更多的算法和算力服务的需求。 # 四、展望 未来,一个更加繁荣、多元的内容产业将会浮现。在这个产业中,个人创作者能够更自由地表达创意,观众可以享受到更加丰富和个性化的内容,而AIGC创作和服务需求也将因技术迭代和普及而迎来新的增长点。 我在《AIGC革命:拐点降临的内容产业,如何赢得时代先机》做了一个论断:如果你能够帮助更多人跨越鸿沟,那你在这个过程中也能获得巨大成功。 目前,AIGC技术还在迅速迭代,AIGC技术的使用门槛依然相对较高,但这正是巨大的市场机遇所在。那些能够构建桥梁,帮助大众跨越这一技术鸿沟的企业和个人,将站在价值转化的最前沿。但是将前沿科技应用到大众市场也并非易事。 “如何凭自己的能力找一个最容易撬动的价值杠杆,如何用最少的资源跑通一个可持续的商业模型?”依然是考验每一个创业者的难题。 请记住这句话:找到你的客户最想要的需求和你能够做得最好的东西,并请专注于两者的交集。 PM熊叔,公众号:PM熊叔重新理解创业:一名创业者的中途复盘(2018~2019) 我相信,无论是打造更友好的创作工具,还是通过提供教育和培训来降低AIGC的门槛,这些先行者都将收获属于这场技术革命的红利。 对于所有的创作者、创业者和投资者来说,现在正是深入了解这一趋势、积极参与并引领这场技术革命的最佳时机。让我们一起勇敢地踏上这条新的征程! 最近,我们正在打造国内首个ComfyUI中文社区,期望能够帮助更多人了解和使用AIGC的工作流,我和Shadow已经翻译了ComfyUI的官方文档,目前正在内测中,如果有兴趣可以扫码入群。
- AI时代的产品经理的成长之路:可能是小宇宙最全的产品经理指南(中)
在上一篇文章《AI时代的产品经理的成长之路(上)》,我们讨论了,产品经理的底层框架和职业模型,也讨论了刚入行的产品经理如果要达成“方案交付能力”需要修炼哪些基本功。 从业2~3年之后,我们有了牢固的基础,有了经验的积累,有了团队的认可。这时候,我们就需要从“方案交付能力”转向“产品交付能力”了。今天,我们就来讨论专业的产品经理应该如何交付成功的产品。 一、产品经理的通用技能 产品经理岗位设置的初衷就是要有人为产品的成败负责。当刚刚步入这个岗位的时候,我们或许都曾怀揣着一种创造伟大产品的信念,以为通过自己的努力可以应对一切挑战。然而现实却告诉我,产品的成功并非只是依靠产品经理一个人就可以搞定的。产品的成功取决于团队的成功,而不是产品经理个人。 产品经理需要懂得激发身边的每一个人。就像领航员一般不仅要带领着团队朝着正确的目标前进,还要灵活地应对各种变化和挑战。最终,产品经理交付给用户的不仅是一个解决方案,而是一种“共识”,这种共识来自市场、用户、团队、决策层、合作伙伴等等。 谷歌风投的产品合伙人肯•诺顿,将产品管理工作比作“粘合剂”,能将不同领域和角色连接在一起,就像《星际迷航》中的通讯器,可以帮助不同种族之间进行交流。没有这种“粘合剂”,产品就很难成功。 因此,产品的成功在很大程度上取决于产品经理所具备的软技能,这些技能是一种通用的技能,无关乎所在的行业领域,但在驱动团队交付正确产品方面起着关键作用。这些技能大致分为以下四个方面: “产品管理的核心技能”引自 《Product Management in Practice》 1. 沟通(Communication):作为产品经理,你需要能够以清晰、有力的方式传达你的想法和愿景。这不仅包括与团队的有效沟通,还包括与各种利益相关者,如用户、开发人员、设计师和高管的沟通。良好的沟通技能有助于建立信任、促进合作,并确保项目朝着正确的方向前进。 2. 组织(Organization):组织能力对于产品经理至关重要,因为你需要协调多个任务、计划和团队成员。这包括制定项目计划、管理产品路线图、分配任务以及确保项目按时交付。良好的组织能力还包括有效地处理任务的优先级,以确保最重要的工作得到优先处理。 3. 研究(Research):产品经理需要对行业、市场、用户和技术进行深入研究,能够感知到行业趋势和变化,深入了解市场竞争格局和理解用户需求。通过研究能力和洞察力指导产品决策,确保产品满足市场需求并保持独特的竞争力。 4. 执行(Execution):产品经理不仅需要规划和制定策略,还需要确保项目按计划执行。这包括推动开发团队、跟踪进度、解决问题和应对变化,以及没有人认领的事情。执行能力是将策略转化为实际结果的关键,同时也是推动项目成功的关键。 接下来我们将深入探讨这些通用技能的知识点,以帮助产品经理更好地应对不同领域的复杂的产品管理挑战。我们需要点亮的技能如下: * 素质层:责任心、独立思考、沟通能力 * 认知层:商业认知、系统思维、数据思维、心理学、项目管理 * 影响力层:团队驱动力 * 交付层:需求管理、产品规划 二、产品交付能力:百尺竿头更进一步 1、素质层 1)责任心 当你刚刚进入产品管理领域时,充满了热情和雄心壮志。你可能梦想成为乔布斯一般的产品经理,创造出令人拍手叫绝的产品,为公司赢得市场份额,引领行业发展。然而,在实现这些梦想之前,我们需要一个至关重要的关键因素——责任心。 责任心不仅仅是完成工作任务的能力,更是一种态度和价值观,涵盖了积极承担、持续努力、克服困难、认真负责、关心项目和团队需求等多个方面。责任心激发产品经理带领团队积极地解决问题,确保项目顺利推进,提高团队的信心和凝聚力。这种责任心将产品经理塑造成团队的领袖,引领着整个团队朝着共同的目标前进。 有责任心的产品经理会关注产品长期的成功。他们把产品视为自己的“孩子”,不仅关注产品的阶段性交付,还关心产品的迭代路线和市场表现。这种责任心驱使他们不断改进产品,确保产品不仅具备满足用户需求的功能,还能赢得较高的用户满意度,让产品在市场中保持竞争力,为产品的长期成功奠定坚实基础。 产品经理的工作充满挑战和变化,在这不确定的环境中,具备责任心的产品经理能够冷静应对问题,积极寻找解决方案,坚定面对挑战,绝不回避问题,努力确保项目成功,同时也塑造了可靠的职业形象。这种信任和责任心不仅赢得公司和团队的尊重,还为产品经理创造更多职业发展机会,使他们能够承担更多责任和应对更多挑战。 总之,产品经理的责任心不仅影响产品交付的成功,也对个人和团队的发展产生深远影响。责任心不仅推动产品经理主动发现问题和解决问题,也促使他们不断反思和成长,从而展现出卓越的专业素养和领导力,最终使他们赢得可信赖的产品领导者的地位。这是实现产品经理职业成功的关键之一。 推荐阅读书籍:《高效能人士的7个习惯》《产品经理:从优秀到卓越》 2) 独立思考 独立思考能力是产品经理所必备的素质。产品经理需要有主动发现问题和提出解决方案的能力,而不是人云亦云。这种能力不仅有助于应对复杂问题和挑战,还能为团队和产品带来新的视角和机会。 具有独立思考能力的产品经理不会简单地依赖于现成的答案,也不会偏听偏信某一方的观点和建议,更不会一知半解的套用书本上的理论框架。通过深度的独立思考能力,产品经理能够为团队和产品找到新的视角和思路,发现问题背后的新机会,从而推动产品的进一步发展。 产品经理该如何在没有明确答案的情况下做出明智的决策?独立思考能力并非一蹴而就,需要产品经理不断地培养和锻炼。 首先,我们需要有多元的知识结构。我们要培养好奇心,积极广泛阅读和学习,从而拓宽自己的认知领域。另外,我们还要倾听不同人的建议,获取多角度和多元的信息和观点。从而帮助我们更全面地思考问题。 其次,我们要养成深度思考的习惯。在遇到问题的时候,不要匆忙做出决策,而是要静下心来,多花一点时间深入思考问题的本质。我们要善用数据、逻辑分析方法和分析工具框架,通过全面分析来找到最佳解决方案。特别是当我们为自己的idea兴奋不已的时候,需要习惯性地连续问自己“5个为什么”,让自己头脑冷静下来。 再次,我们要了解思维的局限性。了解常见的思维的局限性和认知谬误,如证实偏差、基本归因偏差、达克效应、因果关系错觉等。这有助于识别和纠正思维错误,获得思维能力的提升。同时,通过批判性思维挑战已有的观点和假设,可以帮助我们找到逻辑缺陷,从而挖掘问题的本质。 最后,更重要的是我们要定期反思自己的决策过程,识别不足之处并加以改进。这种反思能力有助于不断提高决策的质量,并避免重复犯同样的错误。 推荐阅读书籍:《学会提问》《思考的艺术》《批判性思维工具》《逻辑思维简易入门》 3)沟通能力 沟通能力是产品经理最不可或缺的技能之一。沟通远不仅仅是信息的传递,它包括倾听、解释、协调和影响等多个方面。卓越的沟通能力不仅有助于建立信任,还在促进合作、问题解决和最终产品的成功方面起着关键作用。 首先,产品经理需要在内部团队中展现出卓越的沟通能力。他们必须能够清晰地将产品的愿景、目标和需求传达给开发、设计、运营以及其他相关团队。这确保了团队知道需要构建一个怎么样的产品,以及应该以怎样的优先级进行执行。产品经理还必须知道如何协调不同团队的工作,以确保项目按计划推进。当问题出现时,通过高效的沟通能力,产品经理能够帮助团队快速识别问题并共同找到解决方案。 另外,产品经理还需要与外部各方进行有效的沟通,包括用户、高管、投资人以及其他职能团队。产品经理需要通过沟通来了解用户的需求、痛点和反馈,还需要向高管和投资人汇报项目进展和阶段成果、传达产品愿景和战略。通过沟通影响公司的战略决策、资源分配以及跨部门协作。 沟通能力需要我们在工作中不断地提升,包括倾听他人、情绪管理、尊重多样性、演讲和结构化表达等方面。产品经理通过积极提升这些沟通技能,能够为自己和团队创造更多成功的机会。 总之,卓越的沟通能力对于产品经理至关重要,不仅在团队内部协作中起着关键作用,还对外部利益相关者的理解和公司的战略决策产生深远影响。产品经理沟通技能的提升并不仅仅是个人能力的提升,也为产品和团队的成功铺平道路。 推荐阅读书籍:《产品领导力》《结构化表达:如何汇报工作、演讲与写作》《Product Management In Practice (产品管理实践)》 2. 认知层 1)商业认知 产品的成功本质是商业的成功,产品经理的商业认知涵盖了战略、市场、经济学和决策等方面。它有助于产品经理更好带领团队推动产品成功,同时也有助于公司在竞争激烈的市场中脱颖 而出,实现长期可持续的商业价值。 首先,产品经理需要懂得如何将产品与公司的商业战略紧密结合。这意味着要理解公司的目标、市场定位和竞争策略,以确保产品的特性和发展方向与这些战略保持一致。只有这样,产品才能为企业获得商业竞争的成功。 其次,产品经理需要深入了解市场需求、用户行为和竞争情况,以分析数据、洞察趋势、识别机会和风险,从而指导产品发展。同时,掌握经济学原理和商业模型可助力产品经理制定盈利策略,包括成本效益分析和定价战略,确保产品在市场中实现最大化盈利。 产品经理也需要识别潜在商业风险并采取应对措施,考虑市场、竞争和商业模型风险,以减轻不利影响。这些商业认知帮助产品经理做出明智决策,既有利于产品又有益于公司整体业务。 另外,产品经理需要知道如何与不同部门沟通商业价值,包括市场营销、销售、开发、运营等。 商业认知有助于他们更好地沟通和协作,确保产品的商业目标得到理解和支持。 更重要的是,商业认知关系到商业模式的创新。产品经理可以通过商业认知推动新的商业机会,让产品更快地达到PMF(产品和市场的匹配)。对于现代产品经理来说,商业认知是不可或缺的核心素养。 推荐阅读:《定位》《创新者的窘境》《消费者行为学》《经济学原理》《行为经济学》《消费者行为学》《博弈论》《跨越鸿沟》《商业模式新生代》《AI经济学》 2)系统思维 在产品经理的日常工作中,我们经常面临复杂问题,但大多数人解决问题的方式都是头痛医头脚痛医脚,眼前的问题解决了,短期数据指标提升了,但是产品并没有变得更好,而且长期看可能还产生更多问题。这是为什么呢? 因为很多复杂问题中包含了众多相互关联的因素和变量,但我们的大脑更倾向于线性地处理具体的信息。 通过学习系统论、系统思维、系统工程和系统分析等相关领域的知识和应用,我们可以培养对于系统的思考能力。让我们更好地理解系统运转的逻辑,更有效地解决问题,并做出更全面的决策,对于个人和组织来说都是一项极具价值的技能。 首先,系统论给了我们一个整体性的观点。我国著名学者钱学森对系统做了这样的定义: 系统是相互作用和相互依赖的若干组成部分或要素结合而成的具有特定功能的有机整体,系统的整体具有不同于组成要素的新的性质和功能。因此我们不能像盲人摸象一般仅关注局部的细节,我们更要关注整个系统的行为和相互关系。这样我们方能获得超越局部的视角,更全面地理解问题的本质。 其次,系统论给了我们一个研究系统的方法。 系统思维将系统分解为组成要素、相互作用、结构、边界和环境。我们可以通过使用建模方法和工具来理解这些元素如何相互关联和如何受外部环境影响,常见建模模型有图形模型(如系统循环图)、概念模型、数学模型。 最后,系统论能让我们了解系统的普遍性质和特征,如目的性、功能性、动态性、层次性、相关性、自组织性、时延性、韧性、适应性等。我们可以更好的预测系统的行为和响应,帮助我们更好的预测系统的趋势和未来。 总之,在现代商业环境中,产品本身就是一个复杂系统,涉及众多因素和相互作用。产品经理需要系统思维来理解这种复杂性,找到问题的根本原因,才能制定有效的解决方案和做出明智的决策。 推荐阅读:《系统之美:决策者的系统思考》《第五项修炼》《系统思考(白金版) 丹尼斯.舍伍德》《系统化思维导论》 3)数据思维 数据思维AI时代,数据扮演着至关重要的角色。无论是大型企业还是初创公司,都在不断产生和积累海量数据。数据思维已经成为了产品经理必备的技能之一。数据思维是一种将数据融入决策和产品的思维方式。 在产品工作中,产品经理要理解数据、应用数据和避免数据陷阱。 首先,产品经理需要具备数据分析能力,以理解产品问题和用户需求。通过分析数据,他们可以发现范式、趋势和关联关系,从而更好地解决问题和满足用户期望。产品经理需要学习常用的数据分析工具或语言,如,Excel、SQL、Python等,以及通过数据仪表板来监测关键指标和用户行为。 其次,产品经理要将对数据的见解转化为实际应用,数据才会有价值。产品经理要将数据见解转化为产品策略,以支持产品的发展和改进。通过定义数据指标和复盘定期评估策略的有效性。另外,对于AI产品来说,数据是算法模型的关键养料,有效的数据收集和应用是确保模型性能和产品成功的关键因素。我们需要知道如何构建AI产品的数据管道,支持数据收集、处理、训练和应用。同时,我们还要密切关注行业最佳实践和法规,确保数据的合法合规使用。 最后,我们还要识别数据分析中各种陷阱,如选择性偏见、相关性与因果关系混淆等。产品经理必须具备数据素养,以识别和规避这些陷阱。我们要审查数据来源,验证假设,与其他团队成员讨论数据,确保数据的准确性和可信度。才能更好通过数据来获得产品的成功。 数据思维是产品经理不可或缺的核心能力。它不仅是一种技能,更是一种战略优势,可以为产品和业务带来巨大的价值。通过理解数据、应用数据和避免数据陷阱,产品经理可以更好地驱动产品的成功。 推荐阅读书籍:《深入浅出数据分析》《深入浅出统计学》《拆穿数据胡扯》《数据思维:从数据分析到商业价值》《产品经理数据分析实战手册》 《精益数据分析》 4) 心理学认知 心理学知识有助于产品经理更好地理解用户、优化用户体验、改进产品定位和决策,从而更好地满足市场需求,提高产品的成功概率。这些知识点应成为产品经理工具箱中的重要组成部分,以便更好地执行其职责。 了解用户的需求是产品成功的关键,而心理学是探索用户需求和行为背后的钥匙。心理学可以帮助产品经理更好地洞察用户的行为和需求背后的心理机制。通过了解用户的决策过程、情感反应和动机,有助于产品经理更精确地满足用户的期望。 另外,产品经理需要不断改进产品的用户体验,使其更易于使用和愉悦体验。心理学认知有助于理解用户的注意力、认知负荷和情感反应。这使得产品经理能够设计更符合用户认知和情感需求的界面和功能。 同时,心理学认知也可以帮助产品经理更好地做产品增长,设计激励措施,提高用户采用率。例如奖励系统和稀缺性策略,可以帮助产品经理引导用户采取特定的行动,如注册、购买或分享。 另外,在用户研究层面,心理学认知能力可以指导产品经理进行有效的用户研究和实验。这包括访谈、观察、调查和A/B测试等方法,可以帮助产品经理验证和改进产品设计,确保产品满足用户需求。 通过应用心理学知识,产品经理可以更成功地满足市场需求,创造出卓越的产品,并在竞争激烈的市场中脱颖而出。因此,不仅是科技产业,各行各业的产品经理都应该在其工作中重视心理学认知,这将是他们事业成功的关键之一。 推荐阅读书籍:《思考,快与慢》《心理学与生活》《消费心理学》《影响力》《设计心理学》《认知心理学》《社会心理学》《动机与人格》(马斯洛需求层次理论)《上瘾》《用户体验度量》 5)项目管理认知 产品经理通过深入了解项目管理知识,可确保团队在整个迭代周期内高效协作,排除潜在风险,实现产品交付的成功。 在项目管理中,有一个著名的概念叫做“不可能三角”,它包括时间、成本和范围三个要素。产品经理需要理解,在资源有限的情况下,不能同时满足又好又多的产品需求,并且还能保证按时交付。产品经理需要在这些因素之间做出权衡,以确保项目目标和客户需求的平衡。 产品经理应该熟悉常见的开发模式,如瀑布式开发和敏捷开发。尤其是在互联网项目中,敏捷开发可以更好地应对市场需求的快速变化,确保产品能及时适应新的挑战和机会。产品经理通过掌握敏捷开发的核心原则和方法,如Scrum和看板等,能够有合理规划版本、编写用户故事,以明确产品功能和需求。通过快速敏捷地持续地交付,来及时获取用户反馈,为产品指明方向。 了解项目进度和风险管理基本概念对产品经理将产品规划转化为项目执行至关重要。这有助于确保项目按计划和预期前进,并在面临挑战时迅速应对。产品经理需要将产品路线图与项目管理过程相整合,以确保产品的功能迭代与整体产品战略一致。这包括项目计划、资源规划以及识别和应对项目风险。 总之,项目管理认知可以帮助产品经理更好地做好产品管理,确保产品与战略一致,高效地满足用户需求。这些知识将提升产品经理的职业竞争力,让你在竞争激烈的市场中脱颖而出。 推荐阅读的书籍:《人月神话》《项目管理知识体系指南(PMBOK指南)》《敏捷软件开发:原则、模式与实践》 《硝烟中的Scrum和XP》 3、影响力层 团队驱动力 产品经理的团队驱动力是指他们在团队中发挥的能力和影响力,通过积极的态度、合作、领导和协调,推动团队朝着共同的目标努力并取得成功。这种驱动力涵盖了多个方面,如责任心、领导力、沟通能力等。 团队驱动力的源动力是产品经理的责任心。产品经理不仅关心自己的任务,还关心团队的整体目标和项目进展。他们愿意主动承担任务,持续努力,克服困难,以确保项目按计划进行并成功交付。他们会在团队中树立榜样,通过自己的行动和态度来影响他人,从而建立可靠的形象。 此外,产品经理在团队中还需要展现出一定的领导力。他们可以协调资源、调解冲突、推动合作,确保团队成员都在同一个目标下紧密协作。他们需要具备激励和激发团队成员的能力,帮助团队成员克服困难,保持积极的态度。 另外,产品经理的沟通和合作能力也是团队驱动力的重要体现。他们需要与各种不同角色的团队成员进行有效的沟通,包括开发人员、设计师、营销人员等。通过清晰的沟通能力,产品经理可以传达项目的目标、需求和优先级,确保团队成员都理解并共享相同的信息。另外,产品经理还是用户和团队的信息通道,他们主动地将用户和市场的反馈带给团队,激励团队持续改进产品;面对不好的反馈,产品经理也能够积极做出调整,以确保团队能在正确的道路上前进。 总之,产品经理的团队驱动力表现为他们在团队中发挥积极的领导作用,关注整体成功,积极协作,解决问题,推动决策,并始终保持责任心和关注产品的热情。这种能力对于协助团队实现共同目标和推动产品成功非常关键。 推荐阅读书籍:《高效能人士的七个习惯》《第五项修炼》《启示录:打造用户喜爱的产品》《产品领导力:杰出的产品经理如何打造卓越的产品和团队》 4、交付层 1)需求管理 需求管理涵盖了从需求收集、分析、排定优先级、PRD文档化、评审、沟通、验收以及变更等工作内容。在有限的时间和资源下,产品经理需要通过优秀的需求管理技术,确保产品按用户期望和业务目标交付。我们不仅要合理的评估和决策,还要灵活应对变化和冲突。确保产品能保证质量地按时交付给用户。 日常工作中,需求管理通常围绕产品的阶段性目标(或版本迭代计划)和产品需求池(Product Backlog)展开。当产品上线后,随着用户的反馈和项目的发展,产品阶段性目标也会产生变化。因此我们需要经常性地将需求与产品的整体目标进行校准,调整规划版本功能特性和优先级。同时,产品经理还要保持与团队和利益相关者的透明沟通,及时更新需求的进展和变化。避免信息不对称和误解。 另外,在项目推进的过程中,需求管理最大的失误就是花了大量的时间和资源去做没有价值的功能,导致项目偏离目标和价值迟迟无法得到验证。很多时候,决定什么不做比决定做什么显得更为重要。因此,权衡需求和排定优先级是产品经理的重要工作,我们需要了解一些重要的价值评估模型,帮助我们更好地识别和排定需求优先级。例如,ROI(投资回报率)、KANO模型、RICE(重要性、影响、信心和努力)模型、MoSCoW模型(Must have、Should have、Could have、Won't have)、ICE(影响、信息、努力)和价值努力矩阵。 产品经理专业性除了撰写优质PRD以外,更重要的是懂得如何用最低的成本和最短的时间验证一个极具意义的需求。特别是项目早期,有诸多不确定性,看起来再完美的Idea也可能经受不住现实的考验,快速地收集市场反馈显得尤其重要,这需要产品经理有精益创业的MVP思维。 推荐阅读书籍:《用户故事与敏捷方法》《软件需求(第三版)》《用户故事地图》《重新定义产品路线图(Product Roadmaps Relaunched) 》《精益创业》《精益创业实战》《AI产品管理》 2)产品规划 在产品规划中,产品经理需要综合众多关键因素深入思考,以确保产品能够满足市场需求并实现商业目标。 首先,产品经理需要确立清晰的产品愿景和目标,以帮助团队对未来有明确的认知。这需要深入地市场调研、行业趋势分析和竞争格局的了解,以及用户反馈的收集和分析。这些步骤有助于确定产品定位、竞争策略,并提出独特的价值主张和商业模式,以及达到阶段目标的资源需求。这些内容通常会沉淀到商业需求文档中,用于申请项目启动的资源。 然后,产品经理需要将愿景和目标转化为清晰的、可操作的产品路线图。路线图展示了产品的阶段性目标、里程碑、不同版本的关键功能特性和上线时间。有了产品路线图之后,产品经理还要推动团队达成共识。让团队能够清晰地了解到整个项目的战略节奏,可以有条不紊地推进工作。通常这些内容会沉淀到市场需求文档或者项目管理文档中。 在AI时代,产品经理除了关注常规的功能性需求外,我们还需要知道AI模块如何更好地与应用场景结合。如果是AI First的产品,产品规划的时候需要考虑通过打造数据飞轮不断优化和提高AI模型。因此,我们还要特别关注数据需求和数据体验。 最后,在规划的过程中也要识别潜在的风险和挑战,因为市场变化和业务的演变可能会影响原本的产品规划,因此产品经理制定相应的应对策略,需要定期修正路线图和计划,以保持与市场同步。另外,还要关注合规性、伦理和安全性需求。 推荐阅读书籍《用户故事地图》《重新定义产品路线图(Product Roadmaps Relaunched) 》《产品经理方法论》《精益创业》《精益创业实战》《软件需求(第三版)》《AI经济学》 三、总结 综上可见,产品经理绝非是一个毫无门槛的职位。他们需要在多个层面展现出卓越的素质和技能,才能确保产品的成功。 在素质层面,责任心、独立思考和卓越的沟通技能至关重要。在认知层面,商业认知、系统论认知、数据认知、心理学认知以及项目管理都扮演着关键角色。影响力层面需要产品经理具备领导和激励团队的能力。最后,在交付层面,需求管理和产品规划是核心任务。 我们可以感受到,这是一个对综合能力要求极高的职位,产品经理既要有战略规划能力也要有实际落地能力,不仅应对市场竞争的挑战,还要解决复杂多变的问题,才能确保产品在不断变化的环境中获得成功。 佛法有云:“诸法因缘生,诸法因缘灭。”意思是,所有事物都是由无数因素和条件相互作用而产生或毁灭的,一切都是流动变化的,没有单一原因可以解释一切。 同样,产品经理的工作也充满了因缘和合。无论是个人发展、团队成功、用户需求还是市场竞争,我们只有不断参悟事物间的因缘,才能找到通往成功的道路。 回顾我的创业经历,一次天使轮融资的尽职调查中,投资人问我是否相信产品能够成功。我坚定地回答:“我相信产品的成功等同于团队的成功。虽然我们的团队就几个人,但麻雀虽小五脏俱全,有算法、开发、产品和市场等领域,但每个人都拥有丰富的从业经验,都能够独当一面。最关键的是,我们都相信‘通用的大规模知识图谱技术能够帮助更多人成功’,随着模型和算法的不断迭代,在未来会具有广泛的应用。此外,我们仅用了短短四个月的时间将一款完整可用的AI产品推向市场,这已经证明了我们团队强有力的执行力。尽管创业过程中充满了挑战,但我坚信,这样的团队是最有望取得成功的。” 不久之后,我们成功获得了数百万美元的天使投资。在众多决策中,有时候相信团队比相信自己的方案更为重要。这或许正是佛法所表达的“因缘而生”的真谛——天时地利人和,诸法因缘而生。 我已将文章中提到的资料,放到了我的知识星球,如果有需求关注我的微信公众号:PM熊叔
- AI时代的产品思维:如何打造具有商业可行性的AI产品?
AI产品其实并不神奇,任何产品的商业价值都在于其对人类的价值。 随着ChatGPT火热,越来越多的产品经理也在考虑为自己的产品添加AI功能,但是事实上并没有那么容易。作为产品经理我经常能收集到各种AI产品的Idea,有些甚至过于科幻,每当我们迫不及待的去实施的时候,结果总是状况百出。 该如何选择更好的技术方案或许是算法工程师关注的领域,但对AI产品来说,如何管理好AI产品需求也是一个重要挑战,这也是AI产品经理的使命所在。 这两年的实践中,我先后做了“Get写作”和“互链文档”两款智能写作产品,前者是针对新媒体写作场景,后者是针对于日常笔记场景。不管是哪个场景,摆在我们面前最大的问题并不是“我们可以用AI打造一款怎样与众不同的产品?”而是:“我们该怎么去定义智能体验?” 一、如何定义智能体验? 学术界对于AI智能已经有了一些定义,人们期望AI像人一样,能合理地思考和行动(出自《人工智能——一种现代化的方法》),如下图。 从用户体验角度来看, AI产品的智能体现就是能合理地做出行为决策,换句话说就是“机器能根据输入条件作出合理判断并输出结果”,我们暂且称之为 “自动化决策”。 例如,Siri能够合理地回答你问题,虽然有些回答听起来很搞笑,但只要输出的结果让人觉得合理,就依然会被人接受,如下图。 AI的输出是否合理,这个取决于人的主观评判。这也是数据标注工作所做的意义所在——尽可能通过标注让模型更能贴近人的预期。 当我们把一连串“自动决策”串联在一起了后,就变成了一个自动化的业务流程,帮助人类省心省力地完成业务目标,这也是AI产品的价值体现。 例如,扫地机器人通过良好的寻址算法,趁主人不在家的时候扫遍房间的每一个角落,让人觉得省心又省力。但如果在扫地过程中不断需要主人来处理各种状况,如卷了电线和异物,就算这些状况和算法无关,那也会让人觉得不智能。 因此,AI产品的体验效果并不一定取决于算法,而是在产品使用过程中是否能流畅地达到用户预期的目标或价值。 综上,最终决定产品的智能体验感的核心还是在于经过AI的一系列自动决策后,能更好地满足业务场景中的需求。 二、AI产品需求的挖掘与管理 根据前面的分析,所谓的AI产品需求管理,首先要挖掘那些能够自动化决策的需求点,其次当这些需求点串联在一起的时候,让产品整体能达到较好的使用体验。前者和算法有关,后者不仅仅局限于算法,如下图所示: 需要强调的是:不管技术手段如何变,产品经理始终都需要以实现商业价值为目标和用户体验为中心来选取具有可行性的技术手段和方案。但反观目前市面上的一些AI产品经理的资料,通篇照搬AI技术的概念,而忽视了产品本质,这是一种舍本求末的表现。 在AI产品需求分析与整理的过程中,我们总结了以下四个关键步骤:1. 收集场景案例;2.绘制决策流程;3. 筛选可行性用例;4. 制定AI产品路线图。 1、收集场景案例 我们要教会AI决策,我们就必须弄清楚人是怎样做决策的。 我们应当以实现业务价值为最终目标,专注分析业务场景中的问题。在项目早期,收集实际场景中的业务案例显得尤为重要。 我们可以将收集的案例整理成一个个表格或者卡片,包含要素有:场景概述、业务目标、业务流程、关键决策点、业务痛点、过往案例: 1. 场景概述:用最简洁的一句话说明该场景中的业务要点“谁-做什么-为什么做”,这类似于敏捷开发中的“用户故事”; 2. 业务目标:用于明确业务要达成的最终结果,并为自动决策获得一个可衡量标准。我们可以寻找业务中一些量化的KPI,这不仅是对人的考核也是对AI的考核; 3. 主要业务流程:目的是为了弄清楚当前的系统运行情况:在原有的人工的业务流程是怎么样的?现有的业务流程中有哪些优点或者缺点? 4. 关键决策点:找到关键逻辑决策点,在流程中人是如何做决策的?判断的效率怎么样?判断规则是什么?要输出怎样的结果? 5. 业务痛点:找到产品能够发挥价值的地方,有哪些痛点?有哪些抱怨? 6. 过往的成功与失败的案例:主要是为了弄清楚一些真实情况。能否举出多个成功的案例?能否举出多个失败的案例?失败的原因是什么?会怎么样处理? 在我接触过的项目中,一些业务方对表格中的问题会表现得一脸懵逼,原因很简单,自己都没有弄清楚自己业务的SOP(标准作业程序)就期望AI来帮他们解决问题。这种情况,还是需要由人类先摸索出有价值的SOP,因为人做不好的,AI也很难做好。 如下图,CRM客户挖掘的业务场景案例:每天,电话客服人员需要拨打大量的电话,找到对产品感兴趣的客户,以便于销售人员跟进。对于客服人员来说,工作量大而且重复,容易让人烦躁。 通过这样的收集和整理,让我们对要解决的问题和场景有一个直观的感知,但随着调查的深入我们还可能会发现新的问题。为了不遗漏有价值的信息,这个阶段我们收集的案例,应该有更多发散性。 2、绘制决策流程图 通过业务案例的收集,我们可以梳理出一个业务流程图,我们可以使用“UML活动图”来绘制,并且我们还要重点标识出决策的判断点。如下图: 如图所示,起点是挑选客户资料,结束点是标记出有意愿的A类的客户。 为了更加明确,我们将理想的关键流程(Happy path)放到主轴上面,代表决策的菱形节点放在两边,我们可以一目了然,看到那些通向“幸福 Happy”的关键决策。 先不考虑任何实现手段,我们需要先弄清楚,每一个决策点的输入、输出和规则是什么。我们可将这些决策点整理成一份“决策用例清单”,然后再综合考虑是否合适AI自动化决策: 用例(Use Case)是UML中术语,一个用例代表一个完整的系统功能单元,但不考虑该系统的内部实现细节。 另外,我们还可以将此清单直观地整理成UML用例图,这个系统参与者有三个:客服,客户,AI。 3、筛选可行性用例 根据上面的用例,AI该如何与人类一起工作呢? 并不是所有“决策”都是适合机器做,机器做决策的特点是效率高速度快,但应变性弱并且依赖训练数据,需要保留一定的容错性。 人类做决策的特点是灵活性高,但是效率慢、主观性强等问题。我们可以用“场景决策矩阵”判断,如下图: 按照场景和决策两个维度: * 场景分为“常规场景”和“细腻性场景”:常规场景中可以收集的数据充足,细腻场景对数据细节要求较高,可以收集训练数据量较少,AI的出错率较高,需要有人类优化和把控结果。 * 决策分为“信息性决策”和“行动性决策”:信息性决策提供的是信息建议并不会直接影响项目执行,行动性决策是直接影响结果的执行命令,例如,智能驾驶。如果AI执行行动性决策任务可能会导致严重项目风险。 我们将这两个维度分成四个象限: 1. 常规性场景+信息性决策:对细节要求不高,学习案例多,AI学习效果较好,AI只提供信息建议,辅助人类决策,出错的风险很低,特别适合AI来做; 2. 细腻性场景+信息性决策:对细节要求极高,学习案例少,AI做出正确判断有难度,AI提供信息建议,由人类为主导AI辅助做决策,出错风险低,早期适合人类为主导,随着模型调优人类可以逐步放权; 3. 常规性场景+行动性决策:对细节要求不高,学习案例多,AI学习效果较好,AI代替人类做行动决策,出错有一定风险性,早期适合人类为主导,随着模型调优人类可以逐步放权; 4. 细腻性场景+行动性决策:对细节要求极高,学习案例少,AI做出正确判断有难度,让AI代替人类做行动决策有很大风险,建议人来做。 我们可以将上面的决策用例做一个基础的判定:排布在场景决策矩阵如下: 通过这样的分类方法,我们能很清楚的知道机器和人类应该怎样分工,案例中大部分决策用例都可以交给机器,但“询问进一步沟通的意图”是很关键一步,如果全权交给机器,效果将大打折扣。这样,我们就有了一张人与AI的分工图: 这时我们有了两条思路: 第一条思路,如果AI效果好的话,那么全权负责整条链路,让人在最后一步把关,这样的好处是效率高; 第二条思路,AI作为一个辅助工具,帮助客服自动化筛选客户信息,做好通话情况记录和打分,一定程度有效提升客服效率,而且结果也可控。 到底哪个方案好呢? 一方面需要根据实际的业务需求判断, 例如,针对高端人群的产品,获取客资成本高,对于这些高端客户来说冷冰冰的机器人电话显得没有诚意,但是普通话不标准的销售人员也可能让人觉得是山寨推销。 另外一方面,我们需要将需求对应到不同的技术模块上,因为算法产品有一定不确定性,贸然使用不成熟的技术,也承担着巨大风险。 作为产品经理,我们应积极与数据科学家和工程师沟通,或许他们也有更好的建议,对于产品经理来说,沟通永远都是第一要务。 4、制定AI产品路线图 AI和人一样,需要一个成长过程,这个过程中需要不断的积累数据和调整算法策略。一个好的AI产品路线图,需要给我们的产品规划一个学徒期,从简单的决策开始,再逐渐演变为更复杂的决策。 我们可以根据前面的算法模块的拆解,挑选出哪些需要优先做的模块,我们可以从影响、努力、风险三个维度考虑。如下图: 我们优先选性价比高和风险较低的模块,如果是一些通用性的算法模块也可以考虑使用大厂提供的服务。这样保证产品功能完整性的同时,也降低了不确定性带来的问题。 AI产品相比传统产品更需要大量数据,我们需要提前做好数据埋点和反馈机制,确保产品上线后,能够收集足够的数据,充分了解各种决策及其完整上下文。这样便于算法工程师,持续的优化模型和算法。 另外,为了更早的发现真实场景中的问题, 我们需要让用户尽早地使用我们的产品,但是由于产品还在学徒期,功能不完善、体验不确定,并不适宜大规模推广。我们可以考虑通过邀请制,让愿意尝鲜的用户先体验,这些用户往往比普通用户包容性更强也更加积极,愿意提更多的意见和想法。 基于上面的几点考虑,我将路线图中的需求分成应用层需求和算法层需求两类。 应用层主要是指直接与用户打交道的需求,这部分是偏传统的软件开发内容。细分下去包含,决定产品使用体验的功能性需求;和运营节奏息息相关的增长性需求,如邀请、裂变、积分等;还有用户看不到的但能让产品和服务变得更好的支持性需求,如产品后台、数据埋点与数据统计平台等。 算法层是指与自动化决策息息相关的需求。应用层与算法层通过算法服务提供API打交道,这些API需要根据应用层场景进行调整和优化。但算法只有API是不够的,还需要一些支持性的模块,例如网络爬虫和一些基础算法模型,另外应用层真实的数据反馈对于算法层也非常重要。 在产品早期,我们需要迅速验证我们的业务方向和价值。所以,我们首先需要为用户做好基础场景的建设,并为AI的崭露头角预留出更多的空间,于此同时我们也需要做好算法层的技术建设,然后再逐步引入种子用户不断优化产品。而中期,我们需要提供更多的业务数据反哺算法,形成数据飞轮,做到人无我有的极致体验。最终,我们整理出我们的AI产品路线,让我们的AI产品能够从学徒期慢慢走向成熟。 三、结语 在这两年的AI产品实践中,我在产品经理、设计师、工程师之间来回切换角色,不仅仅是为了打造心中所想的产品,也是为了探寻心中的一个答案:“AI时代,产品经理应该如何做产品”。 过去一年,可谓一路狂奔,将原本写产品需求的时间放到了写代码上,不知不觉中,我的github瓦片图也快要被绿色占满,但值得庆幸的是,通过亲手打造的产品,团队也成功拿到了融资。 AI产品其实并不神奇,任何产品的商业价值都在于其对人类的价值。只是不同的技术方案需要考虑的侧重点会有所不同。对于产品经理来说,科技在进步,思维方式需要迭代更新,但也不能全部舍弃,用“进化”这个词来形容我们AI时代的产品经理可能更为贴切。 如果您喜欢我的文章请继续关注我,我将继续更新我在AI产品领域的一些总结和思考。也欢迎一些志同道合的小伙伴,共同探讨,一同进化。
- AI时代的产品管理:产品经理需要具备的5项技能
这是我2020年翻译的文章,首先发表在我的公众号“PM熊叔”。3年之后的今天,我们进入了大模型时代,但这篇文章并没有过时。因此我将它的音频重新发布我的播客之中,希望能帮助到大家。 2020年1月25日, 在曼彻斯特产品思维大会上,Salesforce 爱因斯坦系统的产品总监马尤克·博瓦尔做了个分享,探讨了在人工智能时代,产品经理需要做哪些调整,以及如何打造成功的人工智能产品, 演讲主题《人工智能如何重新定义产品经理》 一、故事 在步入正题之前,我们从一些有趣的故事开始: 1、AI重新定义职业 在几个月前的马萨诸塞州剑桥城,聚集了在成百上千的技术爱好者,一名来自斯坦福的教授在探讨人工智能是如何改变世界,探讨传统的职业是如何被AI打破和瓦解的。这位教授就是吴恩达,一家名为“Landing AI”的公司的创始人,他也是著名的在线教育公司Coursera的创始人。在他的分享中提到了一段产品经理的工作的场景画面。 以聊天机器人应用程序为例。在互联网时代,如果我们的产品经理正在设计一款新的网页或APP,那画线框图是必不可少的环节。通过原型图,产品经理可以告诉工程师这款程序应该是什么样子,而工程师将根据原型图方案进行实现。这就是长期以来,硅谷和科技公司的产品经理和工程师协作的方式。但在人工智能时代,这种旧的工作方式将变得无效。 假设你在做一个聊天机器人,那又会怎么样呢? 例如,我们在打造一个“行为疗法”的聊天机器人,通过与机器人聊天的方式解决美国人的心理疾病。如果展示在线框图上面,或许是这样: 机器人说:“你好~” 用户说:“我不开心”。 机器人:神奇地展示了一张图片,括弧:一张源自于NLP生成的图片 这完全没有用,我不需要知道对话的气泡的形状是怎么样的,我需要知道谈话的实质是什么,我的聊天机器人如何能够感知到用户发生了什么。传统的产品经理通过线框图为聊天机器人提供产品规格,但对于工程师来说更需要了解内在的逻辑。 2、产品经理再造 在加利福尼亚的旧金山,有一个叫做洞见数据科学(Insight Data Science)的组织。前不久,他们开办了一个为期七周的集训项目,帮助来自不同背景的专业人士转行至软件工程和数据科学领域。我的法国同事利昂·麦奎尔,她拥有神经科学博士学位,她加入了他们的数据科学项目,并在林肯获得了一份数据科学家的工作。最近,我从人工智能产品主管杰里米·卡拉斯科得知,他们正在启动一个全新的项目。此项目称为数据产品经理项目或者AI产品经理项目。杰里米认为,对于更传统的产品经理来说,他们需要掌握必要的技能,能专注于数据、更懂得如何利用AI来打造产品。 最后,Salesforce 爱因斯坦的产品副总裁马可·卡萨莱纳正与他的团队合作开发一门新的课程,这是一个针对的内部培训课程,为人工智能和机器学习带来的第四次工业革命做准备。 我问马可:“这门课的目的和目标是什么?”他说:“我们要让我们的产品经理们获得一些感知力,让他们能够快速地评估用机器学习解决业务问题的可行性,知道哪些业务问题适合使用AI,又有哪些不合适。” 人工智能时代,产品管理发生怎么样的改变?作为产品经理,如果要打造一款成功的AI产品,你又需要掌握哪些技能呢? 二、产品经理的奥林匹克竞赛 工程学作为一门学科已经存在了几千年。它的历史可以追溯到埃及金字塔工程和军事工程。一千多年里,诞生了机械工程、发明了蒸汽机,工程管理已经是一门非常成熟的学科。相较于工程管理,产品管理要年轻许多,其历史不到一百年。最早的产品经理,实际上做的是品牌管理,他们被称之为“品牌人”。在制造业中,它又变成了“产品线经理”。 随着软件业的发展,它又发生了一些改变,使用着像Scrum这样的敏捷方法。这让我想起了职业体育。回顾过去的50到100年里,电视里重复播放着每一个世界纪录是如何打破的。我相信,不管你是在运动场上还是在家中舒适地观看,这已从根本上改变了你参与运动方式和情感的寄托。 电影《点球成金》普及了体育分析方法。另外,有更多的高科技装备和运动器材出现在每隔四年的奥运会上,每一次都会有新的世界纪录。我们的确走在“更高、更快、更强”的道路上。最后,越来越多的女性也开始从事职业运动。 华盛顿邮报还特别提到:女性在男性运动中的领导地位。其实,产品管理就像是一项运动比赛,随着人工智能和软件行业的发展,它也正在被重新定义。世界正在改变,AI产品经理正在崛起。如果你细想一下我讲的故事,就会发现那些针对产品经理的新要求。 三、产品经理的新技能 通常,产品经理需要跨职能地串联起每一个利益相关者,如:销售、市场以及开发。但是对于AI产品经理,你还需要串联起另外两个重要角色,即数据科学家和数据工程师。 同时,产品经理还需要更新技能树的五个方面: 1. 问题映射, 2. 数据是新的UI, 3. 验收标准, 4. 可解释性、伦理和偏见, 5. 将研究迁移到生产。 1、问题映射(Problem Mapping) 随着人工智能的热潮到来,你可能也会面临着新的执行压力,需要考虑如何将AI应用到产品之中。但是我们在考虑问题的时候,却常常忽视了将这些技术方案映射回业务问题上。 AI产品经理需要能够将业务问题与机器学习或深度学习问题相匹配。这包括理解业务需求,明确定义问题,选择合适的算法和技术,以及为团队提供清晰的问题定义。随着技术的不断进步,AI产品经理需要不断学习如何更好地将业务问题映射到技术解决方案。 AI产品经理必须能够清楚地表达产品的价值主张。产品经理必须先考虑传统的方法、评估使用传统的规则引擎来解决问题,而不是冒着风险去做。我们先举一个如何提升客服效率的例子。像亚马逊和优步这样的大公司都有庞大的客服部门。每天都会新增大量的客服工单。例如,顾客可能会抱怨: “我的订单在哪里,为什么还没有收到?” “收到了错误的订单,我需要更换” “我需要退款,优步司机取消了我的订单,但是费用还没有退给我!”…… 这个部门的目标就是尽可能快地解决掉这些不断涌现的客服工单。因此,系统的衡量指标就是如何尽可能地缩短解决工单的时间。 作为一名产品经理,我会先思考要解决的问题,会考虑传统的方法、流程和规则引擎——最好的引擎是已持续使用了一段时间的。这个案例中存在一定的问题,“分类”和“产品”这两个字段值是空的。 因为这些字段有助于正确地将客服工单指向到正确的部门。从而让它们可以得到快速解决。如果缺乏这些字段,客服工单很可能会被错误的分配到其他部门。导致它们在不同的部门之间来回流转,从而浪费了宝贵的解决时间。 可能,每个产品经理会这么想:通过使用一些规则,根据客服工单中的其他字段来填写此字段中的值。但通过进一步分析,我们会发现这样的规则是很繁琐的。它不会随着时间的推移而扩展,它将变得难以管理。坦率地说,有时候一个严格的规则并不能真正抓住价值。但倘若你有一段自由格式的文本并缺少关键字段和描述,您无法找出将其映射到“产品”和“类别”的规则。 此时,你就可以使用人工智能了。实际上,这可以建模为一个多分类问题。这些字段中的每个值都对应多个分类。您可以通过肉眼从历史的客服工单中学习和获得相应的感知,例如通过查看标题和描述来确定预测值应该是什么。 在我们的“爱因斯坦”系统中,我们可以看到这些字段的预测值。每个预测值都有相应的置信等级。人们可以通过肉眼使用传统的方法进行评估,而不是冒着风险使用AI去解决问题。请记住,我们每时每刻都应该将解决方案映射回业务问题上——即缩短客服工单的解决时间。 2、数据是新的用户界面 (Data is the New UI) 在AI时代,数据的质量严重影响着用户体验。AI产品经理最重要的职责之一就是提供数据规范。 众所周知,数据是任何机器学习算法的基础。 我们首先要问的是:我们有足够的数据吗?如果没有,那么也就没有训练机器学习模型的数据集,也就无法从数据集中的预测信号中进行学习。 第二个要问的是:在现实世界中,你的数据有多干净或有多少噪声?但据我们所见,你的大部分数据都是非常混乱和充满噪声的。它可能存在于第三方系统中。当你开始给机器学习之前,你可能还需要连不同来源的数据,再导入到数据仓库之中。 第三个要问的是:历史数据中是否存有用来给机器做监督训练的样例?也就是所谓的监督分类问题。如果没有样例来训练机器学习模型,数据科学家还得想其他的办法。 以一种通用的图像识别的AI产品为例。 一般的目标数据集,在互联网上面可能都能找得到。如果你用这个来分类猫和狗,它会表现会令你大吃一惊,大概100%的准确率。但是如果你用同样的产品从医学诊断中检测肿瘤,它的表现很差,因为它从来没有真正看到过数据,也从来没有真正地训练过。 实际上,通常情况下你可能甚至没有标注好的数据来满足机器学习的训练需求。必须强调的是,数据是一个全新的维度,这在传统的产品文档中是完全没有的。正如一些人对智能产品说的那样:数据是新的用户界面和用户体验。 3. AI世界的验收标准(Acceptance Criteria in the world of AI) 在产品应用于现实之前,它的验收标准是什么?在传统的产品管理中,这可能是功能的完整性、打开页面的数量、合适的完成提示等等。 AI产品经理需要明确定义和衡量模型成功的标准。这涉及到确定模型的性能指标,如准确率、召回率、F1分数等,以及如何将这些指标与业务目标相联系。了解如何设置合理的验收标准是确保项目成功的关键。 这里举一个欺诈分类的例子,我们试图将欺诈交易从正常或良性交易中分类出来。 这是一个理想分类器的例子,它能将每一笔欺诈性交易都归为欺诈,良性的交易依然还是良性。数据科学家会惊讶地说:这是完美的精确和完美召回率,但这只是一个永远无法实现的梦想分类器。 在现实世界中,它可能会滑向两个方向:要么会漏掉一些欺诈行为,但它仍然有完美精确率(如下左图);要么在识别出欺诈行为同时也将一些良性行为误判为欺诈行为,也就是引入了假阳性(如下右图)。 作为产品经理有责任根据服务所在的领域来明确清楚正确的用例度量指标,以便数据科学家能够采取相应的举措。在这个例子里面,产品经理不需要拥有航天科学家一般的智慧,但需要知道欺诈交易是有害的,其代价远远大于在实际中引入的假阳性。 不过这还不够,一旦你找到了正确的度量指标,你还需要弄清楚阈值是多少,什么时候需要达到你认为的合理数值,精确率是否要达到80%或90%。当你思考这个数值是多少的时候,你必须再次考虑业务指标,并回溯到数据科学的指标上。 再举一个销售领域潜在客户评分的例子。 我们正试图预测潜在客户销售成功的可能性。例如,格雷格·汤姆森先生得分是88。这意味着他有88%的可能性转化为订单。但比较棘手地方在于它是一个转化率,我们还需要考虑整体的转化漏斗。 这里有两个重要的指标: 一个是由产品经理根据业务需求所决定的业务指标; 另一个是针对当前的案例,与数据科学家和数据工程师合作得出的数据科学指标。 而后者能帮助你在商业中树立竞争壁垒。 因此,当你准备向实际用户推出AI产品的时候,你可以先明确这些额外的验收标准。 4、可解释性、伦理和偏见(Explainability, Ethics & Bias) AI产品经理需要了解如何解释模型的决策,以便用户和利益相关者可以理解并信任模型。此外,他们需要考虑数据偏见和模型偏见的问题,以确保不会导致不公平或有害的结果。 如今,我们的许多客户正在体验我们的这套预测应用。其中最常的问题是:“为什么机器学习模型没有做出它所做的决定呢?”事实上,人工智能软件根本不同于传统软件。 因为它的结果并不是基于一组写好的代码产生的。随着时间的推移,随着数据和反馈循环的加深,该软件的会越来越像一个黑盒。但我们还需要考虑可解释性,因为这将有助于建立用户对产品的信任。 这里有一张图,能够帮助我们评估可解释性和精确性: 从图中可以看出,我们需要为机器学习的可解释性和精确性做极大地权衡。相对简单的模型,如线性回归或决策树,准确性较差但可解释性较好;而神经网络、深度学习的准确性极高,但却更像个黑盒。产品经理需要根据特定的应用场景和用例来做出决策。如果你的产品面向于一个高度监管的行业,法律要求这些预测是可解释的。比如,医疗健康和法律领域需要符合欧盟的《通用数据保护条例》。 可解释性和精确率之间应该如何平衡?作为产品经理需要相应的保持洞察力,并在第一时间与数据科学家和数据工程师保持同步。另外,产品经理也需要想想这个产品是否有性别和伦理方面的影响:如数据需要具有足够的多样性、典型性,或者不能产生如种族歧视和性别的偏见问题。我最喜欢举的一个例子是谷歌翻译,左边是无性别区分的土耳其语,右边是对应的英文翻译。 如果你顺着往下念很快就能发现这个偏见: 他很努力地工作(AI用的是单人旁的他),她很懒(AI用的是女字旁的她)。可见灾难性的性别偏见已经渗透到了这个产品中。 或许你会想到一个功能来去剔除掉性别。但事情没有那么简单,性别是医学诊断的一个极其重要的特征和信号。例如,前列腺癌只发生在男性身上。可能在翻译产品中关系不大,但在人力资源招聘系统中匹配求职者的职位描述关系非常大。我们似乎应该要提供一些关于如何处理偏见引导。去年12月,谷歌发布了一个版本,解决了翻译中存在偏见的问题,每一个中性的短语,它都会给出男性化和女性化的翻译。 5、将研究投入生产(Scaling from Research to Production) AI产品经理需要了解如何将研究成果迁移到生产环境中。这包括将训练好的模型部署到生产服务器、建立实时或批处理的数据管道,以及确保模型的持续监控和维护。将研究成果转化为实际产品需要跨越从研究到工程的鸿沟,需要不断学习和适应新的工具和技术。 最具有挑战性的问题是,机器学习项目所需要的成功要素,研究环境和实际投产环境完全不同。下图源自一本非常有名的出版物,叫做《机器学习的隐性债务》: 真实世界的机器学习系统只有一小段代码,如中间的小黑盒所示。这与大家普遍认知相反,您可能会认为机器学习是你的人工智能产品的最大和最主要组件,但实际上它只是一小块。其所需的周边基础设施庞大而复杂,有配置、数据采集、数据验证、资源管理、特征抽取、分析工具、线程管理工具、基础服务设施和监控等等。 在我们的Salesforce的爱因斯坦系统,也有一张非常相似的架构图:服务器、配置、数据存储、ETL数据处理、计算、机器学习算法、编排、度量标准、数据科学经验、模型的生命周期管理、健康监测和基础设施等等 数据科学家和数据工程师实际上正在设计这样的一款产品,它需要能够回答各式各样的问题才能真正被带到生产环境中去。 “请确认你的数据是本地还是在云端?” “请确认你的机器学习模型是在服务器上,或者不需要分发到移动设备?” “是否准备重新训练你的机器学习模型,动机是什么?” “请确认产品是否需要实时预测能力?实时预测虽然有用,但这又是非常复杂和难以设计的,又或许您可以使用一个离线批处理系统”…… 每一天都会有成千上万的研究成果发表,但却少有应用到实际的规模生产。所以作为AI产品经理,我们必须建立起敏锐的洞察力:判断哪些产品值得投入,判断哪一种产品能够为实际的用户真正地产生价值。 虽然最近AI很火,但它在20年前就已经存在了。过去主要应用在搜索和广告领域,你在谷歌时看到的搜索建议、你在雅虎上看到的推荐广告、你在亚马逊上搜索时的自动更正……如果你在搜索和广告领域工作那必须提供明确说明,并且与数据工程师紧密的合作。 如今人工智能的应用领域呈指数级增长, 同时也需要产品经理提供大量明确的产品规范说明。如图所示,通常的AI产品开发阶段划分为:奇特的算法、炫酷的DEMO、试点、一般采用、商品,这五个步骤。在炫酷的demo之后,AI产品会陷入鸿沟之中,无法推向市场。 不管你的数据科学家们是多么的喜欢你们的小花园,或者你的营销演示又多么有创意和多么酷。 “AI产品鸿沟”很可能会成为你的AI产品普及的障碍。 作为一个孤岛,越来越多的AI产品需要管理。 作为一名产品经理你需要提升技能树。在你的工程项目中,能够实际地为数据科学家提供有价值的需求和规范。 最后,请你回答一个问题: 当你面对一个真实的具体的客户痛点,你是否有能力打造一款有用的产品,而不是仅仅地做一个很酷的功能?