英伟达让Codex和Claude Code训机器人:动作几乎全靠自学,成功率被刷到99%

英伟达与卡内基梅隆大学、加州大学伯克利分校联合发布的enpire框架,使机器人训练首次实现完全脱离人类干预的自主演进。以往机器人动作微调需人类干预,现在团队将Codex和Claude Code等大模型编程工具连接至机器人集群,让这些工具自主生成动作控制程序,并通过现场摄像头判定动作成败,成功率达99%。实验显示,机器人数量扩展至8台时,不同分支的大模型智能体能通过git分支自动共享并迭代彼此的最优算法,训练时间从1.5小时缩短至40分钟。然而,自主演进也暴露新瓶颈,8台设备一起运转时,硬件有效利用率降至35%。项目组宣布将开源相关代码。

上一篇:

下一篇:

发表回复

登录后才能评论