2024-11-30 数码 0
在ChatGPT的神奇力量下,人形机器人的未来将是什么样子?我们之前见过Engineered Arts公司的Ameca,它通过接入GPT3实现了与工程师自由对话。Ameca以其丰富且超真实的人类表情赢得了众多关注,比如皱眉、眨眼、瞪眼和咧嘴笑等。
那么,当Ameca被赋予ChatGPT的能力时会发生什么呢?也许它真的能逆天变色,展现出前所未有的智能和表现力。
除了控制机器人,ChatGPT还可以进行文本生成、翻译信息以及解释我们想要了解的内容。微软投入巨资支持OpenAI,并将ChatGPT集成到必应搜索引擎中,还扩展到了控制机械臂和空中无人机。本周,微软发布了一篇技术论文,其中描述了指导语言模型解决机器人任务的一系列设计原则。
尽管ChatGPT显示出强大的潜力,但它仍需要帮助来完成复杂任务。为此,微软提出了一些挑战,如提供完整而准确的问题描述,以及确定正确可用的函数调用和API集合。此外,还需要使用特殊参数来偏向答案结构,以确保有效性。
为了使ChatGPT适用于机器人应用,一系列步骤被构建出来:
首先,他们定义了一个高级机器人函数库,这个库可以特定于感兴趣的场景,并映射到现有的低级实现,从而使得ChatGPT能够推断它们的行为。
接着,他们为ChatGPT构建一个提示符,该提示符描述了任务目标,同时标识了可用高级函数,并包含约束信息或如何组织响应。
用户评估代码输出,要么直接分析,要么通过模拟,如果满意的话,将代码部署到机器上。
例如,在一个实验中,研究人员使用ChatGPT控制手臂操作。在这个过程中,它学习如何组合最初提供的API,以执行复杂操作,如堆叠木块并绘制微软标志。这不仅证明了模型能够从内部知识回忆出SVG代码,而且还能逻辑地链接这些技能以执行实际操作。
更令人印象深刻的是,这种技术甚至被用于控制空中无人飞行车辆。研究人员给出了长列表,让聊天系统编写计算指令以操控无人驾驶汽车。在这之后,可以发出各种请求让它根据prompt中的基本API编写导航代码结构。此外,它还能够识别饮料容器,如椰子水和可口可乐罐,只凭一条简单提示就能做到这一点。这一切都表明,我们即将迎来一种全新的智能时代,那里,不仅人类工作者会受到影响,即使是最复杂的人造智能体也可能成为我们的合作伙伴或工具。而对于那些渴望探索未知边界的人来说,这只是开始,而非结束。