英伟达推出通用机器人模型: Project GR00T

tiankong @ 2024年03月21日  世界观

GR00T模型使机器人能够理解多模态指令,如自然语言、视频和演示,并执行多种任务。

GR00T基于NVIDIA深度技术堆栈开发。

在其Isaac Lab中进行模拟,类人学习,在OSMO上训练、编排系统,用于扩展模型,最后将学到的能力直接转移并部署到Jetson Thor芯片上。

通过GR00T提供动力的机器人将能理解自然语言,并通过观察人类动作模仿运动,快速学习协调性、灵巧性和其他技能,以便在真实世界中导航、适应和互动。

1、saac Lab中的模拟:利用Omniverse Isaac Sim上的一个新应用——Isaac Lab,为类人机器人的学习提供一个虚拟的模拟环境。Omniverse Isaac Sim是NVIDIA提供的一个仿真平台,可以模拟真实世界的物理特性和环境,使得机器人能在这个虚拟环境中进行学习和测试,而无需在真实世界中进行。这样不仅可以加速开发过程,还能大大减少成本和风险。

2、在OSMO上训练:OSMO是一个新开发的计算编排系统,用于管理和扩展AI模型的训练过程。通过OSMO,开发者可以有效地利用计算资源,扩大模型训练的规模和效率。这对于训练大型的、复杂的AI模型来说是非常关键的,特别是对于需要处理大量数据和进行复杂计算的生成式AI模型。

3、部署到Jetson Thor上:Jetson Thor是NVIDIA新开发的边缘计算GPU芯片,专门设计来为像GR00T这样的AI模型提供必要的计算能力。边缘计算芯片可以直接在数据产生的地点(如机器人本身)进行数据处理,这样可以减少数据传输的延迟,提高处理速度和效率。将GR00T模型部署到Jetson Thor上意味着类人机器人能够实时地、高效地处理和响应多模态指令,执行各种任务。

GR00T已经与 1X Technologies、Agility Robotics、Apptronik、Boston Dynamics、Figure AI、Fourier Intelligence、Sanctuary AI、Unitree Robotics、XPENG Robotics 等公司展开合作。

(视频)