特别放送:一个 AI 创业者的反思、观察和预测

特别放送:一个 AI 创业者的反思、观察和预测

42分钟 ·
播放数25020
·
评论数168

《人类简史》作者尤瓦尔·赫拉利近日在接受采访时说道,“距离AI真正应用到人类生活中也不过十年的时间。ChatGPT 就像 AI 世界里的单细胞生物阿米巴,那么 AI 世界里的霸王龙会是什么样子?从阿米巴进化为霸王龙又会需要多长时间?”

作为国内最早拥抱 AI 技术的投资机构之一,我们认为在一个技术刚诞生的前几年去预测未来的终局形态和大赢家是很困难的。因此在这一波AI技术革命的早期,我们坚持以创业者为中心,相信优秀的创业者终会找到方向。在 AI 信息大爆炸的当下,我们也希望让大家听到来自一线 AI 创业者的声音。本期节目我们邀请到了 Magi 创始人、真格基金 EIR 季逸超 Peak 和大家分享他作为一名从 2012 年起就加入 AI 行业的创业者,对新一波AI浪潮的反思、观察和预测。

季逸超Peak是一位技术小天才,在高中时期独立开发了获得 Macworld Asia 特等奖的猛犸浏览器,也因此登上《福布斯》杂志的封面,获得真格基金的天使投资。后来他又主导研发了Magi知识引擎及相关的知识图谱信息检索等NLP技术

在本期播客中,他聊到了在LLM的领域内,创业公司应该从哪些角度切入去和大厂竞争?LLM领域有哪些问题亟待解决的问题?国内做大模型的公司是否过早进入了优化的阶段?为什么懂AI的产品经理是稀缺资源?同时,我们也选取了部分闭门会议中的讨论内容和大家分享,如果你有更多好奇的问题,欢迎在评论区留言互动,投资团队会空降评论区加入讨论噢!

【嘉宾】季逸超Peak Magi创始人、真格基金EIR

【时间轴】

02:15 有限制的舞台给了创业者更多机会

05:14 不属于你,但与你共生的数据是真正的壁垒

09:29 别把解决了最显眼的技术瓶颈当做自己唯一的护城河

11:20 不仅是技术,行业、规模、利益分配都是历史包袱

12:27 合规是一个动态的问题,审核一定要与核心解耦

22:54 向量数据库无法让模型突破自身的上下文限制

26:36 懂 AI 的产品经理是稀缺资源

31:13 真正的多模态模型还未到来

32:54 RLHF 是手段而不是目的,其本身复杂且不稳定

36:25 大量AI创新将诞生在看不⻅的地方

37:54 AI 人才面临价值危机

40:06 前所未有的技术平权,是一个新的开始

【精选讨论】

Tianjie:乔布斯曾说,如果你足够在乎软件的话,自己就会去做一个硬件。移动互联网时代,从PC到Mobile诞生了全新的计算设备,你觉得这一波会不会有一些就是垂直整合的硬件出现?

Peak:有可能会的。比如 rewind.ai 可能是一个初步的数字永生,但它目前是依托于我的工作电脑。说不定未来就有一种更尊重隐私的录音设备,我一辈子的行动都有一个东西在录制,回头可以训练一个我的LLM。所以我觉得可能会从私人、长续航的角度会诞生一种垂直的硬件

Terry:如果Context length变长,比如 Magic.aI的LTM-1模型现在声称支持5 million的长度,它是否可以取代向量数据库的作用?

Peak:首先,我认为更长的有效上下文窗口取代向量数据库是肯定的,它总体来说我觉得会是一个更优的方案,能解决很多向量数据库不能做的事。但我对LTM-1模型其实不是特别乐观,因为像大家已经能用到的 Claude 100K 就是能接受很长的context(上下文),但是能接受很长的输入和能理解很长的 context (上下文)这两个东西是完全不一样的。目前我们并没有一个很清晰的思路能怎样做出让它理解更长的窗口。

Peak:在LLM 等一系列新的开发范式之后,人才分化特别严重,就逐渐只剩下最精英的一群人做核心技术,剩下全都是做交付。懂技术的离市场太远,而离客户和产品近的又完全没有什么竞争力,所以长期来看可能符合创业者画像的人才的供应可能会减少。

Yusen:对创业公司来说,技术和产品长期紧密地耦合是不好的。就像在(移动)互联网领域,产品经理并不需要从技术方面了解如何去搭建一张“网”,因为互联网早已成为了基础设施;从另一个角度说,反而是技术的乐高化会带来创业机会的爆发。会搭乐高的人从长远来看是多的,但自己能造出来好用的乐高的人少。

【节目制作】

后期:虫二

【联系我们】

公众号:真格基金(ID: zhenfund)

收听渠道:小宇宙|Apple Podcast|喜马拉雅

邮箱:media@zhenfund.com

如对节目有任何的建议与期待,也欢迎大家在留言中互动~

展开Show Notes
12:16 干货满满,都是语速和思维很快的大佬
Yvaine_Pan
Yvaine_Pan
2023.6.20
这信息有点太密集了…………
这就是思维在前面飞,嘴巴在后面追吗?太牛逼了。
小龙_fQXL
小龙_fQXL
2023.6.20
相比这篇播客的干货而言,我更觉得他讲PPT的方式更值得大家学习。真知灼见,娓娓道来,少整虚的,可以借鉴。
HD367687y:请问哪里有ppt看啊?
Sophia的小宇宙:可以蹲到吗?
13条回复
河森
河森
2023.6.21
大佬谦虚地说自己丧失了zoo喵呜lity,但这40分钟的分享能从信创指标一直细到模型权重初始化再回到投资理念,何尝不是zoo喵呜lity的诠释?有一类人无法用工程师、管理者、分析师来标签,他们是天生的创业者。
河森:zoom ability居然不让发…
林志衡:猜了下,大概是里面的 m a b i 是句骂人的话。。
3条回复
飞天_AO7
飞天_AO7
2023.7.09
我把音频听了不下五遍,然后又找到文字稿学习,同时参考其他人学习心得和分享。终于把整个内容大致了解。感谢季逸超,希望你能多出一些分享和类似的讲座。还有,你的PPT在哪里能找到,看不见?
PeakJi:感谢您的认可!PPT 其实没有公开发布过,我们会找个合适的渠道或办法供大家获取!
不动点_739:求一个文字稿
9条回复
16:54 这一点非常认同,找到头部企业合作的时候,最大的障碍是对你的信任感,其次才是你能帮它们解决的问题。很多时候方案过了很多轮,对方告诉你如果只是解决xx,那么我找那家就可以了
太棒!有听友群吗!
温馨提示:这期播客不适合下饭。昨天原本计划一边吃面一边听,结果吃了几口就停下来,信息密度忒高,原本就有限的脑细胞真的不够用,一边吃一边听真滴跟不上,消化不了啊啊啊啊啊啊
ANANN_
ANANN_
2023.6.20
这期要0.8倍速听才跟得上😂
慧_w:一样😂
iDarjeeling
iDarjeeling
2023.7.09
第一次见识了人脑cpu的参差🥹
haitaoyao
haitaoyao
2023.6.28
27:24 midjourney 每次返回四张图,用户选择的结果就是 midjourney 的数据飞轮,这一点 ChatGPT 做的不如 midjourney。知道如何构建自己数据飞轮是 AI 产品经理的核心能力
刘海_0rAJ
刘海_0rAJ
2023.6.22
想认识一下PeakJi,我目前是llms app开发的,对于database那一块向量数据库很赞同,想必大佬一定是真的长期有了解的,我想认识一下
京哥:我在做数据库,目标是支撑好上面的ai (llm )apps,可以交流下~
Mikiiiiiiiii:想认识一下刘老师,现在有llms app的开发需求
4条回复
ChiChung_
ChiChung_
2023.7.09
37:5931:45 没有垂直模型,只有垂直应用,多模态尚未开始(训练集基于文字)
28:07 懂ai 的产品经理很稀缺
18:56 核心技术相差不大那就可以考虑拼运营,例如给予用户更好的反馈
16:49 ai落地难,复制难,很多客户到最后发现要的不是一个llm 而是更好的搜索。(毕竟aigc 有着太大的随机性)
14:14 文生图 代码实际需求不高:1 有github 2 中文需求不易理解
14:02 职业规划:小天才——技术派——操盘手——老司机
11:53 LLM和信息流广告有冲突
09:20 next big thing 不知道是什么,但是每个next big thing 都是由当时的limitation 转化而来的
07:00 客制化差异化:不属于你,但与你共生的数据是真正的壁垒 专注设备上的llm
felixzhou
felixzhou
2023.6.20
技术牛,表达能力还这么强,厉害👍
05:24 on-print为例?这里没听清楚,课代表解释一下吧
PeakJi:这里讲的是 on-premise 哈,就是私有化/客制化的部署方案。
Aaron_0zQx
Aaron_0zQx
2023.6.20
不属于你,但与你共生的数据是真正的壁垒
- - - -
其中有个问题在于:不可否认的是共生数据在未来是非常有价值的,但是壁垒体现在哪里 ?因为客户的上下文和Prompt,很容易拿着迁移到使用相同大模型的其他产品上,壁垒在哪里。
PeakJi:上下文和 Prompt 确实太浅了,算不上共生。我理解的共生可能是:客户在你的平台上搭建的流程数据、对某个场景/功能的反馈标注数据、为了兼容而转换得到的数据,甚至是一些仅与你的产品兼容的 LoRA。
JKRyan:核心还是「数据」,高质量的数据 + 更好的数据飞轮
8条回复
讲的太棒了,ppt有机会分享吗,最后还得说,天才的神经网络是不是天生参数好啊,哈哈后天又经过finetuning,真的是思维前面飞,嘴巴后面追
01:14 没看shownote时以为Jiyichao 是花名 一度以为是记忆超或者技艺超
haitaoyao
haitaoyao
2023.6.28
31:57 真正的多模态大模型 还没有出现。现在的多模态模型本质都是通过文本训练,真正的多模态模型应该是训练的时候就用多模态数据,输出也可以多模态