2024-11-30 行业资讯 0
在ChatGPT发布之前,就有一家英国机器人公司Engineered Arts将其人形机器人Ameca接入GPT3,实现其人形机器人可以自由地跟工程师对话。我们之前介绍过会做表情的机器人,就是Ameca及其不同版本。它因丰富且超逼真的人类表情而引起了大量的关注,比如皱眉、眨眼、瞪眼,咧嘴笑等等。当Ameca接入GPT3后,它便能与工程师们自由的聊天了。那Ameca接入ChatGPT后,会怎么样呢?也许她真的要逆天了。
ChatGPT以其强大的信息整合和对话能力惊艳了全球。它可以对各种提示和问题生成符合人类理解的响应。它主要用于生成文本、翻译信息、进行计算和解释你想要了解的内容。微软在OpenAI上投入了数十亿美元,并将ChatGPT集成到必应搜索引擎中。此外,还将其功能扩展到控制机械臂和空中无人机。在一个技术论文中,微软描述了一系列可用于指导语言模型解决机器人的设计原则。
“事实证明,ChatGPT可以做很多事情,但它仍然需要一些帮助,”微软在谈到其编程机械臂时写道。而为使这项任务得以实现,对于LLM提出了几个挑战,如提供对问题的完整而准确的描述,以及确定正确可允许函数调用和API集,以及使用特殊参数对答案结构进行偏向。
为了有效地将ChatGPT用于控制应用程序研究人员构建了一系列步骤:
首先,他们定义了一个高级机器函数库,这个库可以特定于感兴趣场景,并且可以映射到现有的低级实现,这样 ChatGPT 就可以推断它们行为。
接下来,他们为ChatGPT构建一个prompt,该提示符描述任务目标,同时标识可用的高级函数,并包含关于约束信息或如何组织响应。
用户评估 ChatGPT 代码输出,要么直接分析,要么通过模拟;用户使用自然语言向 Chat 提供反馈答案质量和安全性。
在迭代后的满意度,在代码部署至设备上。
例如,在一个例子中,将 Chat 使用到了控制手臂操作中的场景。一开始,它用基于课程策略学习如何组合最初提供 API 成更复杂功能,而不需要任何额外指令。这使得模型能够执行诸如堆叠木块这样的操作,并最终还能用这些技能来绘制出微软标志。
此外,还有试图使用 Chat 控制一架空中无人的飞行者。在这个过程中,他们给予长提示列出可能编写命令来操控飞行者的所有选项,然后发出请求让他们根据各种方式控制飞行者。这包括要求识别饮料并导航至饮料位置。此研究表明,即使仅凭基本 API 编码,无论何种形式,无需人类干预,也能完成这些任务。