通用人工智能(AGI)更近了,通用机器人还会远吗?
近半年来,对 AI 从比特世界照进物理世界的呼声越来越高。特斯拉、OpenAI、英伟达、微软、字节跳动和腾讯都在通过自研或投资,更多探索“一个人能干多种活”的通用机器人趋势。马斯克甚至说,他相信未来特斯拉人形机器人的数量是「100 亿」台。
AI 确实正在重塑机器人的进化。不过机器人是个涉及算法、数据、运动控制、机械部件、能源的综合系统,AI 和大模型并不能“阳光普照”。
AI 到底能如何帮我们更接近“终结者”式的通用机器人畅想?本期我们邀请了梅卡曼德创始人兼 CEO 邵天兰来一起聊聊这个话题。
邵天兰毕业于清华大学和德国慕尼黑工业大学,2016 年底回国创立梅卡曼德。梅卡曼德通过人工智能和 3D 视觉能力,让机器人能处理更多灵活任务。
AI 会如何改造机器人,机器人又会如何改变我们的生活与世界,这也不仅仅是一个技术问题。
本期节目我们聊了:
通用机器人近半年热度骤升:
- 类比计算机普及过程:具备通用能力是机器人普及的条件,而不是反之。
- 热潮的直接刺激:马斯克的投入与大模型进展。
- 一些学习范式重被拾起,比如「演示学习」(learning by demonstration)。
今天的机器人实际如何工作,能做什么:
- 完成一个简单动作,机器人调动了感知、决策和规划等种种能力。
- 机器人完成任务仍需大量基于规则的编程,深度学习只占小比例。
- 工厂主为何买了机器人也不用?重新编程适应新 SKU 要两天,两天订单早生产完了!
- 今天的 AI 能打败围棋高手,但无法取代富士康流水线工人。
大模型能改变的,和改变有限的:
- 大模型能给机器人常识,让机器人的“大脑”更发达。
- 但机器人机械部分的进化速率远慢于“大脑”,四肢还很笨拙。
- 更通用的 AI 本身会加速机械工程的进化:在虚拟世界中缩短工程设计、迭代与试错周期。
- AI 来做工业设计,可能会和人有完全不同的方法。
- 机械部分的大进化,需要等待底层技术突破和新范式出现。
人与机器与世界的交互未来:
- 通用机器人的最佳形态是人形,因为世界为人打造。
- 人和机器互相训练,ChatGPT 让人更会沟通。
- 大量工作被机器取代,更多新工作产生,历史总是如此。
- 不相信谁能垄断通用机器人技术,开源力量会与之竞争。
- 未来三年,要是真的能看到通用机器人的雏形就太好了!
相关链接:
《为什么 AI 发展到今天,围棋能下过李世石、柯洁,仍不能完成帮人类洗衣物、做饭这种简单的事?》(邵天兰的知乎回答)
《机器人“应聘”流水线,比下围棋难多了》
《晚点独家 | 字节要造机器人》
《“如果大模型是答案,能解决的问题是什么?”》
登场人物:
邵天兰:梅卡曼德创始人兼 CEO @Mech-Mind
王汉洋:我们中唯一拥有机器狗的人 tw@Hanyangwang
程曼祺:“猫比今天的机器人聪明多了” @momochoqo
剪辑:甜食
封面:世界人工智能大会上,特斯拉人性机器人 Optimus 被围观。
欢迎关注我们的公众号,晚点 LatePost,ID:postlate
---
主持人询问嘉宾,数据驱动的深度学习在当前机器人所完成任务中所占的比例。嘉宾坦诚回答,目前几乎没有机器人是在较高层次用数据或者人工智能驱动的,而在基础能力比如视觉识别会用到。现在都是用人工编程来设计机器人的操作步骤和规则,所以今天让机器人去做一件事情依旧非常复杂。
---
听完后结合自身经历的一些感受:
1. 从物理世界的尺度来看,现在的确是在相当初级的阶段,社交媒体夸大了实际的能力。
2. 我更喜欢看得见摸得着的东西,也希望数字世界能够与物理世界融洽地结合起来,这也是从潜意识中排斥去做纯线上产品的重要原因。
3. 预感自己过去、现在的各种经历都在为未来将要创造的某一个东西做准备,理想的笔可能也只是一个中间状态(不过话说回来,Readwise Reader + Rewind 已经在往设想中的方向去了,当然也还远远不够)。
---
最后,在听这期播客途中,刷出了 3 件独特装备,我的拍拍熊刚到 N4 就可以畅游了,太爽啦!继续刷刷刷。