人形机器人,用大模型「唤醒」钢筋铁骨
在创业尤为艰难的2023年,ChatGPT的爆火,为不少行业带去了新的可能性,人形机器人就是其中之一。
2月初,华为天才少年“稚晖君”离职创业,成立智元机器人,不到半年便完成三轮融资。有行业人士告诉36氪,目前智元新一轮融资的估值已经叫到数十亿元估值。
(资料图)
5月底,北京大学助理教授王鹤成立机器人公司银河通用,3个月时间估值已达过亿美元;据36氪独家获悉,目前一位字节系的高管,也打算联合高校教授进行机器人创业。
大模型加持下,人形机器人公司有了新的生命力,资本关注度也水涨船高,一位机器人公司近期就拒绝了36氪的采访,理由是“问询过于密集,暂时不曝光了”。
据高盛预测,到2035年,人形机器人市场或将达到1540亿美元,成为继智能驾驶电动车后的又一AI落地场景。
和热闹的创投景象形成鲜明对比的是,人形机器人的产业发展依然有其难以解开的桎梏。
学界和产业界研究了50余年人形机器人,进展一直很缓慢——很长时间内,“如何平稳走路”仍是核心议题之一。近期,美国人形机器人公司Agility Robotics的首席技术官Jonathan Hurst在采访中表示:“它现在只是一个两岁半的孩子。”
2020年,软银Pepper机器人宣布停产,原因是“库存太多”卖不动。Pepper能通过面部表情和语调读懂人类情绪,但它只有20个电机,很难做出细致的动作,对话功能来自事先设定的指令,相处体验更像是一款玩具而非智能机器人。
直到2022年底ChatGPT爆火,人形机器人赛道才有了希望的苗头——先不论机器人能否像人一样行动,它至少有了变聪明的可能,可以像人一样进行多轮对话。
通用足式机器人创业公司逐际动力成立于2022年,公司同时研究四足机器人和双足人形机器人。在创始人张巍看来,大模型让人形机器人行业有看到了希望。“大模型让大家看到了从1-100的阶段没那么难了,我们解决好0-1阶段机器人本体的问题,人形机器人商业落地的闭环也可以预知了。”
大公司更不会放弃人形机器人领域的机会。小米早在2022年8月便亮相了“铁大”人形机器人,到2023年又投资5000万元人民币,成立机器人公司;华为更是斥资8.7亿元,全资成立机器人公司极目科技。
今年3月,广义机器人公司追觅科技推出通用人形机器人和仿生四足机器狗Dreame Dog;四个月后,追觅科技通过视频发布了人形机器人的研发进展——视频显示,追觅通用人形机器人已经可以脱离实验室环境,在办公室、林荫道等室内室外场景中行走;还学会了冲制咖啡,在经历了重力拍打、拳击之后,仍能稳定行走。追觅科技人形机器人负责人喻超对36氪谈到,机器人是公司从未动摇的战略,公司在扫地机器人和四足机器狗上的AI算法积累,能在人形机器人上复用。
今天行业看到的大模型,都是通过搜索、对话等软件能力实现,要想将AI落在看得见、摸得着的实体应用,机器人是个可预见的方向,这也是行业为之振奋的原因。
热钱再次涌动,巨头信心百倍,可机器人赛道并不是能够投机的风口,新的机会来了,但旧的问题仍然在。
一、大模型——人形机器人的嘴和大脑
距离软银集团转卖人形机器人行业鼻祖波士顿动力不过2年,人形机器人能够再次火热,要得益于大模型。
很长一段时间,人形机器人的一大问题是它无法和人正常交流,如同停产的Pepper,只能回答设定好的问题。
大模型给出了解法。
大语言模型拥有对话能力,可以赋予人形机器人通识大脑,从而顺畅和外界对话,还可以增加任务理解、拆分和逻辑推理等“决策”能力。
AI带来的技术红利,也让现有的机器人本体焕发生机。不久前,谷歌DeepMind发布了Robotics Transformer 2(RT-2)大模型,它是一个融合了视觉、语言、动作能力的多模态大模型。
谷歌展示了一个演示视频,加载RT-2后,机器人听到“把草莓放入碗里”的指令,会从苹果、橘子等水果中选择出草莓,并且放入碗中。
在这个动作背后,大模型先获得语言指令,再完成了判断信息、拆解任务、感知外部环境、执行任务等功能。
将人形机器人和大模型结合并不容易。机器人执行基于语言模型生成的动作时,会有安全性风险;如果没有足够机器人决策数据做训练,输出的结果会容易漂移,成功率也会受影响。
国内目前也出现了研究类似方向的团队,如李飞飞团队在研究VoxPoser大模型,他们希望通过将外部观察到的数据生成为3D数值图,再搜索出机器人的运动路径的方式,减少直接基于语言大模型生成决策的不确定性。
机器人大模型公司千诀科技也是其中之一,他们希望研究出具有通用性的机器人大脑和应用系统,让不同类型的机器人变得“聪明”。
千诀科技创始人兼CEO高海川向36氪分享了在语言大模型生成机器人运动轨迹上的经验,“为了更好地控制算法,行业可以通过微调、预训练、人工打分等方式,加强对模型决策的自我评估,当机器人判断到失败率会很较高时,可以让人类接管。”
而除了大模型,通用人形机器人还可以和行业模型结合,如质检模型、分拣模型、金融模型等。通过行业模型和专业数据,人形机器人可以了解不同场景的行业knowhow,成为熟练的技工。
一个有趣的现象是,从AI出发的大模型创业者,都希望研究出具有通用性的机器人,而从机器人硬件和运动控制能力出发的创业者,更期待将人形机器人与行业模型的能力结合,承担技工功能。
“我们最初就是想开发能适应不同场景的通用人形机器人。目前,我们已经在机器人的电机、结构、关节集成、运动控制算法等方面都形成了全链条自研能力。下一步,我们会去解决整个批量化的问题,争取明年能看到机器人在部分场景里的落地应用。”谈及追觅对人形机器人未来发展阶段的规划,喻超对36氪表示。
在更远的畅想里,机器人可以和人对话,并能感知、识别人类的情绪,可以帮助人类完成简单的工作,甚至可以和人类谈恋爱,电影《her》中的梦幻场景,或许将在不远的将来照进现实。
二、“你需要10年还是30年?”
“你需要10年还是30年”,这是投资人关于“人形机器人落地”的问题,可见还很漫长。
“人形机器人太难了”,这是很多从业者发出的感慨。行业鼻祖波士顿动力研究了30多年,也逃不过在7年内被3次转卖的命运。
人形机器人本质上是通用 AI 决策能力加上通用的物理运动能力的产物。研制人形机器人需要做好硬件本体、机器人大脑和运动控制上的研发,但到目前为止,这三件事都处于起步阶段。
曾主导过擎朗智能和大模型Minimax第一轮融资的云启资本合伙人陈昱表示,“大模型的应用目前已逐渐落地展开,人形机器人同时涉及到软件和硬件层面,技术成熟度尚不高,落地时间会更久,但这是终极梦想。”
大模型能帮助机器人拥有“大脑”,但移动能力还需机器人本体来执行,它无法帮助企业设计机器人本体。张巍认为,这个难度相当于让大模型能直接设计波音空客飞机或火箭的控制器。
大模型对于物理运动能力的帮助是有限的,AI代替人决策,机器人代替人劳动,不过大模型能做的是把成熟的物理运动能力拼接起来,完成复杂的任务。
人形机器人的操作能力和移动能力需要借助硬件本体的硬件和算法来实现,但在过去50年的人形机器人研究历程中,这个难关一直没有被攻克。
扫地机器人能通过底盘滑动前行,四足机器狗可以靠四肢保持稳定和平衡,人形机器人只有两条腿,行动时只能依赖一条腿保证整个身体的稳定和平衡。
人形机器人需要保持平衡,这也是张巍眼中人形机器人最核心的壁垒——基于感知的运动控制能力Perceptive Locomotion,将感知和控制结合起来,这让机器人能与环境进行不需要预先设定的自由交互。
国内关于运动控制的研究并不成熟。一个好消息是,2018年,MIT仿生实验室的两位成员分别开源了他们人形机器人的本体设计方案和运动控制代码。他们采用的是准直驱电机给了行业方向,这种电机能通过电流准确反应输出端或输入端的力,降低运动控制的难度。
追觅科技对于跨越这个难题充满信心,喻超表示,“我们在运动控制方面一直持续研发;同时,整个行业的火热也会推动这一难题的研究进度。”
喻超以AI导航算法举例:“像我们应用于扫地机器人上的算法,以及四足的导航算法,都有一些不错的积累和实践,这块能力应该会比市面上大多数的公司略强一些。”
在AI识别算法的种类上,追觅的扫地机器人通过学习超过405万组大数据,迭代超过35个版本,可识别环境、物品、人形及宠物四种类型,这样的AI识别算法能力能够完全迁移复用到人形机器人上,并在此基础上训练其理解能力。
在执行能力上,叠被子、擦玻璃、洗杯子、切土豆丝,铺平沙发上的褶皱,这些人类能轻松完成的动作,对机器人来说非常难。
人形机器人需要在零部件上整体性的升级——更灵活的关节,更高功率的电机,更精确的执行器,更灵敏的传感器等,才能即时响应地执行简单如从地面拿起物品的动作。
它还需要执行工具,人类的手拥有22个关节,可以灵活、稳定又力度适中地完成各类动作,但机器人很难实现。灵巧手是和人形机器人身体一样难的事情。腾讯研究院便在研究灵巧手,其“TRX-Hand” ,目前拥有3根手指、8个可独立控制关节。
机器人硬件和大模型成熟后,机器人企业需要将大模型和人形机器人结合。大模型的语言和机器人所使用的代码是两套语言,输入多模态信息后,再输出决策指令,需要很长时间训练,且需要大量的数据。
“机器人的泛语义任务是一件很难的事情,大模型的出现给事情带来了希望,追觅科技也在这个方向做了相应的布局”喻超告诉36氪。
大模型的训练需要很多的数据,当机器人运用到细分场景时,需要收集足够的环境内习惯数据。机器人要想完成丰富的动作,也需要在场景里一步步迭代。
高海川告诉36氪:“大模型生成行动决策需要考虑很多信息和数据,比如物品的种类、物品的型号、房间之间的类型和连接关系,人是否会变动等。”
机器人是个软硬结合的事情,哪怕硬件做好了,没有软件,也无法检验硬件效果。
三、真的需要人形吗?
在与36氪交流的大多数投资人眼中,人形机器人赛道太早了,且存在公司估值过高的问题。
激进的投资人选择下注,保守的投资人选择远远观望。
人形机器人还处于非常早期的阶段,行业对于未来期待的落地场景并未形成共识。人形机器人未来的落地场景并不明朗。
“波士顿动力每年都要发一个不同造型的机器人,恰恰说明了探索商业场景上的困境。人形机器人的可能落地场景包括工业场景,复合清洁和家庭陪伴。”陈昱表示。
人形机器人在环境相对封闭、简单的环境更容易落地。封闭的工厂是一个首选。特斯拉便希望将人形机器人用于工厂,自家的超级工厂是试验田。但人形机器人很难和专机比性价比,尤其是对节拍性、稳定性要求高的场景。
张巍表示:“人形机器人可以替换目前专业机器无法解决的问题,但它需要具有替换至少2、3个不同工种工人的能力,如既能搬箱子,又可以做质检,它最终是一个通用的物理运动平台。”
在商业世界,畅想中,人形机器人可以做大量的简单工作——在银行、博物馆等地承担迎宾工作,在商场当导游,在办公室中处理打印资料等。
人形机器人公司看到的是替代三维清洁场景。目前的清洁机器人只能做地面的清洁,无法处理墙面、马桶等竖状墙面和异形体的清洁问题。这就是人形机器人成本和清洁工人力成本的较量了。
而真正让人形机器人充满幻想的,是走入千家万户。人形机器人具有与人相似的身体结构,能很好地适应家居环境,承担如打扫卫生、家庭陪伴等功能。
不过,环境狭小、复杂的家居环境,以及如叠被子、洗碗、刷鞋等充满柔性化的工作,远超当下人形机器人的能力边界。
做不做得出来,是企业的问题。买不买得起,也是企业的问题。
日本本田ASIMO的单台成本达到250万美元,波士顿动力Atlas的成本为200万美元,这样高昂的成本距离落地非常遥远。行业预估特斯拉2024年的造价将达到2万美元;而小米机器人的成本会大约在60、70万元人民币。
如果,人形机器人的价格能降低到一台电脑、一部手机的价格,只要能做饭和能打扫卫生,想来就会有大批人买单。
2020年,人形机器人赛道还处于一片萧瑟。不过3年时间,大模型已经让人形机器人重现生机。行业从业者用50余年的时间等来了机器人“大脑”的升级,让人形机器人在技术有了跨越,而未来的路,需要的是跨越成本和场景的屏障。
标签:
-
2022-09-15 14:23:06
杨莉娜租借加盟巴黎圣日耳曼 与姆巴佩梅西拉莫斯一起共事<
北京时间9月13日下午,法甲女足俱乐部巴黎圣日耳曼正式官宣中国女足国脚杨莉娜完成租借加盟,合同期至2023年6月。杨莉娜成为目前国家队中第
-
2022-02-07 14:57:45
奇迹!绝杀!女足亚洲杯逆转夺冠!<
刚刚,中国女足上演逆转绝杀奇迹!她们在亚洲杯决赛中3:2力克韩国队,时隔16年再夺亚洲杯冠军!
-
2022-02-07 14:57:45
中国政府与阿根廷共和国政府签署共建“一带一路”谅解备忘录<
新华社北京2月6日电(记者安蓓)国家发展改革委6日称,国家发展改革委主任何立峰与阿根廷外交、国际贸易和宗教事
-
2022-02-07 14:57:43
中华人民共和国和阿根廷共和国关于深化中阿全面战略伙伴关系的联合声明(全文)<
新华社北京2月6日电中华人民共和国和阿根廷共和国关于深化中阿全面战略伙伴关系的联合声明一、应中方邀请,阿根廷
-
2022-02-07 14:57:40
春节假期国内旅游出游2.51亿人次<
春节遇冬奥,旅游年味浓。根据文化和旅游部数据中心测算,2022年春节假期7天,全国国内旅游出游2 51亿人次,同比
-
2023-08-11 18:26:30
人形机器人,用大模型「唤醒」钢筋铁骨
AI进场,人形机器人是否能讲出新故事?
-
2023-08-11 18:04:32
疯狂小杨哥投资成立科技新公司 三只羊与化妆品企业成立新公司
天眼查App显示,近日,合肥得世昌网络科技有限公司成立,法定代表人为
-
2023-08-11 17:41:19
江西婺源:“晒秋”文化季 篁岭农趣多
游客在进行串辣椒比赛。程五坤摄游客在进行吃西瓜“啃秋”比赛。程五坤
-
2023-08-11 17:07:21
*ST慧辰: 根据中登公司定期下发的股东名册,截至2023年8月10日,公司股票持有人数为4,087
*ST慧辰(688500)08月11日在投资者关系平台上答复了投资者关心的问题。
-
2023-08-11 16:51:29
科源制药今日20%涨停 四机构净买入6373.44万元
证券时报e公司讯,科源制药今日20%涨停,成交额7 65亿元,换手率54 71%
-
2023-08-11 16:12:02
世界银行:停电给越南经济造成14亿美元损失
世界银行:停电给越南经济造成14亿美元损失,停电,电力,世界银行,越南经
-
2023-08-11 15:57:42
多模态影像配准研究中获进展
多模态医学影像分析是肿瘤诊断、放疗规划和影像引导的介入治疗等诊疗过
-
2023-08-11 15:14:25
广州本科生入户黄埔区有补贴吗?
黄埔区人民政府2023-08-1110:20
-
2023-08-11 14:49:07
村民花百万在自家地里建房遭强拆
自建房是我国传统建造方式的主流,尤其是在我国农村地区,农村居民几乎
-
2023-08-11 14:07:06
“月球-25”号成功升空!时隔近半个世纪后 俄罗斯将重返月球
俄罗斯周五发射了其近半个世纪来的首个月球探测器“月球-25”号(Luna-2
-
2023-08-11 13:22:25
08 11
1要么把红魔馆大门右边咲夜那个漩涡的若隐若现效果去掉,要么放大一下
-
2023-08-11 12:24:12
康师傅方便面投资公司增资至2.8亿美元
企查查APP显示,近日,康师傅方便面投资(中国)有限公司发生工商变更
-
2023-08-11 11:47:05
汇创达:8月10日融资净买入12.55万元,连续3日累计净买入154.11万元
8月10日,汇创达(300909)融资买入133 58万元,融资偿还121 04万元,
-
2023-08-11 11:22:16
这就是顶级游戏线下?原神FES现场火爆,早上8点入口排起长龙
在8月10日这天,原神首届线下FES正式在上海国际会展中心开幕。作为国内
-
2023-08-11 10:52:53
润贝航科:公司是商飞的三类合格供应商 主要为商飞提供航空材料、消耗件、航空化学品等
每经AI快讯,有投资者在投资者互动平台提问:公司哪些产品可以服务于C9
-
2023-08-11 10:31:20
建议你吃点无花果,理由都在这里了!
目前正是无花果上市的季节,看着一个个鼓鼓囊囊、皮色青绿中泛着丝丝紫
-
2023-08-11 10:17:53
加快突破成长天花板
陈发明无论在哪里,有百亿元级产值、10万从业人员的产业,都会对县域经
-
2023-08-11 09:47:30
湖光秋月两相和的意思是
中秋佳节中有什么寓意?中秋节是中国传统的重要节日,也是一个充满意蕴
-
2023-08-11 09:18:03
北京玉柴首台氢燃料电池正式下线
北京玉柴首台氢燃料电池正式下线,8月8日,北京玉柴兴顺达新能源科技有
-
2023-08-11 08:49:50
中信证券:预计汽车消费潜力在政策刺激下将继续释放
中信证券:预计汽车消费潜力在政策刺激下将继续释放:中信证券表示,汽
-
2023-08-11 08:08:09
光大证券:云计算业务和云流量快速增长,交换机在数据中心市场迎来巨大发展空间
光大证券8月11日研报表示,交换机意为“开关”,是一种用于电(光)信
-
2023-08-11 07:06:33
筑牢数字经济的通信“底座”(人民时评)
坐在家中戴上眼镜就能以360度全景视角沉浸式体验一场演唱会;“井上看
-
2023-08-11 05:55:23
百丽时尚集团加速数字化转型—— “云端门店”提升消费体验
盛夏时节的广州珠江新城,百丽时尚集团(以下简称“百丽时尚”)某直营
-
2023-08-11 04:13:39
美股高开低收阿里绩后收涨4.6%
【美股高开低收阿里绩后收涨4 6%】!!!今天受到全网的关注度非常高,那
-
2023-08-11 01:04:21
天气谚语一年级(天气谚语)
很多人对天气谚语一年级,天气谚语不是很了解那具体是什么情况呢,现在
-
2023-08-10 22:15:35
据华尔街日报:亚马逊(AMZN.O)关闭了其30个服装品牌中的27个品牌。
据华尔街日报:亚马逊(AMZN O)关闭了其30个服装品牌中的27个品牌
-
2023-08-10 21:20:22
美国7月CPI同比上升3.2% 结束连续12个月回落
8月10日,美国劳工部公布数据显示,美国7月CPI同比上升3 2%,结束连续1
-
2023-08-10 20:16:07
众辰科技(603275.SH):IPO发行价49.97元/股 8月14日申购
格隆汇8月10日丨众辰科技(603275 SH)公布,发行人和保荐人(主承销商)根
-
2023-08-10 19:29:34
读书 | 本周人文社科类图书精选
《幻象》[美]丹尼尔·布尔斯廷著符夏怡译新经典文化|南海出版公司本书
-
2023-08-10 18:52:49
市场监管半年谈|陕西:厚植为民情怀 服务经济发展
中国消费者报报道(记者徐文智)7月31日,在陕西省杨凌示范区麦力祺食