> 自媒体 > (AI)人工智能 > NVIDIA引领“通用机器人的ChatGPT时刻”,机器人将迈入量产阶段
NVIDIA引领“通用机器人的ChatGPT时刻”,机器人将迈入量产阶段
来源:科技行者
2025-02-04 16:09:20
209
管理

作者| 金旺

栏目| 机器人新纪元

当14台人形机器人在NVIDIA CES 2025发布会上缓缓升起时,NVIDIA创始人黄仁勋称,“通用机器人的ChatGPT时刻即将到来。”

这是CES 2025的一个高光时刻,也注定将会是全球机器人产业发展的一个历史时刻。

作为如今全球算力供应商,NVIDIA的机器人版图这些年也在徐徐展开。

尤其是在这波由生成式AI推动的人形机器人浪潮下,在数据和模型成为驱动机器人商业落地的关键时,NVIDIA构建了一套完整的Isaac GR00T Blueprint,为通用机器人的训练提供了一个数字孪生训练场。

在这个数字孪生训练场中,藏着的是NVIDIA的三台计算机和一套工作流,以及黄仁勋看到的“通用机器人的ChatGPT时刻”。

01 破解人形机器人的数据难题

2021年8月,在特斯拉第一届人工智能日上,当特斯拉创始人马斯克用“皮套人”伪装的人形机器人登上舞台的那一刻,机器人产业迎来了一个全新的开端,尤其是人形机器人,进入到了一个资本红利期。

与此同时,随着2022年11月ChatGPT的面世,以生成式AI为代表的人工智能技术浪潮的来临,为机器人产业再添一把火,具身智能涌现,机器人产业随之也迎来了一个技术红利期。

在过去两年里,仅仅是在国内,就涌入了数十家人形机器人初创团队,而在这波由人工智能、具身智能催生的人形机器人热潮中,数据成了机器人进化的一大难题。

以全球瞩目的ChatGPT为例,其背后的大模型早在2022年6月迭代到GPT-3时,参数规模就已经达到1750亿,而据中国信通院分析数据显示,大模型的知识密度还在以平均每8个月翻一番的速度增强。

正因如此,才有了GPT系列大模型展现出的越来越超乎想象的知识问答、图文生成能力。

相较于基于海量互联网数据训练出的图文大模型,具身大模型可用的数据量,尤其是聚焦到机器人领域,就显得有些捉襟见肘,以至于不少机器人企业内部都组建了数据采集部门,通过遥操作方式为机器人采集来自真实世界中的数据。

例如,谷歌DeepMind团队与斯坦福团队在2024年1月共同推出的Mobile ALOHA,就是一套基于遥操作模式进行数据采集的低成本开源机器人。

与此同时,特斯拉2024年在大量招聘机器人“数据采集员”,这些“数据采集员”通过穿戴动捕设备和VR设备来为Optimus采集数据,国内智元机器人也于2024年在上海临港区投建了数据采集超级工厂,而出自这一工厂的机器人百万真机数据集AgiBot World在2024年年底由智元机器人对外开源。

这套工作流共分为四步:

第一步,GR00T-Teleop借助Apple Vision Pro在数字孪生环境中捕捉人类动作,这些人类动作被记录下来作为金标准,并在仿真环境中由机器人模仿学习;

第二步,GR00T-Mimic将捕捉到的人类示范动作扩展为更大的合成运动数据集;

第三步,基于Omniverse和Cosmos平台构建的GR00T-Gen通过域随机化和3D提升技术,指数级扩增这个数据集;

第四步,扩增后的数据集作为机器人策略的输入,在Isaac Lab中教会机器人如何在其环境中高效且安全地移动和互动。

作为国内人形机器人领域明星企业银河通用的创始人,王鹤同样相信合成数据是推动人形机器人智能发展的关键,他们也是最早基于NVIDIA Isaac Sim和Omniverse和成机器人操作数据,并研发出了机器人VLA模型的团队。

据王鹤透露,“银河通用已经训练出了全球第一个10亿级参数规模的端到端具身抓取基础大模型GraspVLA,基于这一模型的机器人具备泛化抓取能力,即使面对一些特殊零件抓取任务,只需要采集100条数据并掌握零件名称后,就能实现对这一零件的泛化抓取。”

不过,对于NVIDIA而言,通过这样三台计算机和一套工作流并不是为了制造人形机器人,Deepu Talla解释称,“我们的目标是打造一个平台,让每个人都能创建自己的机器人。”

03 通用机器人的ChatGPT时刻

据《中国人形机器人创新发展报告 2025》统计数据显示,2024年中国人形机器人整机企业有79家,市场规模约为27.6亿元,预计2025年将翻倍至53亿元,2029年有望达750亿元。

市场规模阶跃式增长,是人形机器人产业热潮的真实写照。

为什么我们需要机器人,尤其是人形机器人?

Deepu Talla认为,现在至少有三个原因正在让机器人变得不可或缺:

第一,危险工作,例如矿工或其它在危险环境中工作的人员,机器人可以替代人类承担这些危险任务;

第二,劳动力短缺,人口短缺已经成为一个全球趋势,未来将会由机器人弥补因人口短缺带来的劳动力不足的问题;

第三,养老需求,人口老龄化是如今另一个社会问题,尤其是伴随着人类寿命越来越长,我们未来将需要一个机器人来帮助解决老年人护理和陪伴问题。

然而,作为全球科技领域终极难题,人形机器人一直难以在养老看护、社会服务,以及更多商用场景中得到落地。

以生成式AI、大模型为代表的人工智能技术的突破和迅猛发展,让机器人运动控制能力有了泛化的可能,也让我们看到了人形机器人在现实场景落地的可能。

于是,在GTC 2024上,黄仁勋将来自全球不同国家的9款明星人形机器人请到了舞台上,让全世界看到了人形机器人正在加速照进现实,彼时一并发布的,还有NVIDIA首个人形机器人通用基础模型 Project GR00T。

也是在这时,特斯拉官宣将在2025年量产数千台人形机器人,国内多家明星企业更是早在2024年相继对外公布了人形机器人量产计划。

2025年,我们迎来了人形机器人第一个量产之年,也将迎来通用机器人的ChatGPT时刻。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
王牌竞速:OpenAI的GPT-4被超了
21世纪经济报道记者孔海丽、实习生张奕丹 北京报道这场世人瞩目的国际竞..
全球首个开源GPT-4出世!Llama 3震撼发布,Meta AI免登录可用..
编辑:编辑部【新智元导读】蛰伏许久,Meta刚刚扔出了重磅炸弹:大家期待..
讯飞星火大模型V4.0体验:全面进化,体验不输GPT-4o
在 6 月 27 日举办的讯飞星火 V4.0 发布会上,科大讯飞发布了讯飞星火大..
芝大论文证明GPT-4选股准确率高达60%,人类股票分析师要下岗?..
编辑:编辑部【新智元导读】GPT-4在为人类选股时,表现竟然超越了大部分..
大模型开车哪家强?普渡研究给指南:GPT-4真行啊
白交 发自 凹非寺量子位 | 公众号 QbitAI现在一句口令,就能指挥汽车了。..
谷歌:GPT-4高阶心智理论彻底击败人类!第6阶推理讽刺暗示全懂了..
编辑:Aeneas 好困【新智元导读】刚刚,谷歌DeepMind、JHU、牛津等发布研..
潞晨尤洋:视频生成的GPT-4时刻,3年后可以见证 | MEET 2025..
编辑部 发自 凹非寺量子位 | 公众号 QbitAI奥特曼说,Sora代表了视频生成..
通义千问GPT-4级主力模型降价97%,1块钱200万tokens
5月21日,阿里云方面宣布,通义千问GPT-4级主力模型Qwen-Long,API输入价..
一夜封神!Llama 3.1大模型震撼发布,真正的全民GPT-4时代来了..
Meta更新了许可证,允许开发人员首次使用包括405B参数规模的Llama模型的..
关于作者
司机(普通会员)
文章
901
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40386 企业收录2981 印章生成229720 电子证书1008 电子名片58 自媒体46281

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索