
盖世汽车讯 据外媒报道,谷歌DeepMind宣布推出两款用于控制机器人的新型人工智能模型:Gemini Robotics和Gemini Robotics-ER。该公司声称,这些模型将帮助各种形状和大小的机器人更有效、更细致地理解世界,并与物理世界互动,为人形机器人助手等应用铺平道路。
值得注意的是,尽管机器人平台的硬件在稳步发展,但创建一个能够安全、精确地自主驾驶这些机器人穿越新场景的人工智能模型却难以实现。
为此,谷歌的新模型基于其Gemini 2.0大型语言模型建立,增加了专门用于机器人应用的功能。Gemini Robotics包括谷歌所谓的“视觉-语言-动作”能力,使其能够处理视觉信息、理解语言命令并产生身体动作。相比之下,Gemini Robotics-ER专注于“具身推理(embodied reasoning)”,增强了空间理解能力,让机器人专家将其连接到现有的机器人控制系统。