首页 > 文档云仓 > 行业研究 | 企业研究 > 机械制造|装备仪器 > 机械设备行业人形机器人报告(一):大模型视角下人形机器人的现在和未来

机械设备行业人形机器人报告(一):大模型视角下人形机器人的现在和未来(33页).pdf
  长工   2023-12-25   16465 举报与投诉
 长工   2023-12-25  1.6万

【报告导读】人形机器人的核心价值在于通用+智能,将和工业机器人共同推动制造业智能化。工业机器人虽然技术成熟,但却无法解决泛化性的问题,不适应现代制造业柔性生产的需要。我们认为人形机器人将作为工业机器人的补充,与工业机器人共同推进制造业的智能化发展。“人形”只是表象,人形机器人的核心价值在于通用+智能。未来的工厂中,工业机器人、人形机器人、人工或将以 7:2:1 的比例存在。

以 GPT 为代表的大模型是迈向通用人工智能 AGI 的重要一步。之前的人工智能属于专业 AI,走的是“先专后通”的发展路径。而以 GPT 为代表的大模型具备了一定的常识和推理能力,有望走出一条“先通后专”的发展路径。而具备控制、感知、执行能力的 AI Agent 是大模型落地的重要形式。

LLM 与机器人结合的研究在短时间取得了众多突破,让我们对产业化多了一份信心。我们把人形机器人视为 LLM+机器人领域的 AI Agent。LLM 的引入解决了之前机器人行业的两大痛点:1)交互不便,无法理解人类的自然语言; 2)不够聪明,无法对复杂任务自主拆解。在 LLM 与机器人结合方面,学界取得了众多进展。Google 在 2022 年发表的 SayCan 模型,解决了 LLM 作为语言模型无法适应现实世界的问题;2022 年 12 月,google 发布 RT-1 模型,使人形机器人表现出了泛化性,可以解决未训练场景的任务;2023 年 2 月,微软发表 ChatGPT for Robots,提出用 LLM 语言模型控制机器人的方法,使机器人可以利用 LLM 模型的“常识”和推理能力;2023 年 3 月,google 发布 PaLM-E 模型,把具身信息融入大模型,进一步提升了泛化能力;2023 年 7 月,google 发布视觉-语言-动作(VLA)的机器人模型 RT-2,模型直接输出机器人的动作,泛化能力进一步增长,并为解决机器人数据缺乏问题提供了一种新的思路。

人形机器人的商业化落地需要具体的场景。当前人形机器人产业面对数据不足、算力不足、人机交互安全性、长尾场景等挑战,终极的通用人形机器人还比较遥远,但是基于特定场景的人形机器人可以降低对数据、算力的依赖,有望率先落地。2023 年 10 月,亚马逊宣布已经在仓库试用人形机器人 Digit。自动驾驶与人形机器人有众多相似之处,自动驾驶的发展历程有借鉴意义。何小鹏认为,自动驾驶本质上是机器人科学,智能汽车公司最终也会和机器人公司在技术、产品、生态等等方面融合 。参考自动驾驶的发展历程,我们认为人形机器人的发展也会有 3 个趋势:1)终极的人形机器人还很遥远,但基于特定场景的机器人会率先落地;2)随着人形机器人对大数据、大模型的要求越来越高,数据闭环能力越来越关键;3)端到端模型可以节省算力,但当前受限于数据、规模。区分规划算法、控制算法的多模块的方案更容易落地,其中连接 LLM 和控制算法的 prompt 是瓶颈所 在。


分享

格式

pdf

大小

3.21MB

青云豆

3

下载

收藏(989)

格式

pdf

大小

3.21MB

青云豆

3

下载
989
举报与投诉
确认提交
取消
维权须知

如果您觉得此文档侵犯了您的合法权利,请填写以上内容并提交。请您务必阅读并参照网站底部的“用户协议”、“隐私协议”中关于侵权问题的处理方法,积极维护您的权益,我们将尽快处理以维护您的合法权益。

温馨提示

您的青云豆余额不足,请充值后再下载!

去充值 ×

下载支付确认

机械设备行业人形机器人报告(一):大模型视角下人形机器人的现在和未来.pdf

所需支付青云豆:3

确认支付
取消支付
分享
菜单 登录/注册