2024-11-30 智能 0
未来的奇迹:ChatGPT与人形机器人的融合将是什么样子?
在ChatGPT的诞生之前,一家英国公司Engineered Arts就已经将其创造的人形机器人Ameca与GPT3相连接,使得Ameca能够自由地与工程师进行对话。我们曾经见过那些能做表情的机器人——它们正是Ameca及其多样的版本,它们以惊人的真实性和丰富的人类表情而受到关注,包括皱眉、眨眼、瞪眼以及咧嘴笑等。
当Ameca接入了GPT3后,它便能够自由地交流了。那么,如果它再次接入ChatGPT呢?也许它真的会超越常规。
除了控制机械臂和空中无人飞行器,微软还将ChatGPT集成到了必应搜索引擎中,并且计划扩展到更多领域。最近发布的一篇技术论文描述了一系列设计原则,这些原则可以用于指导语言模型解决机器人任务的问题。
“虽然事实证明ChatGPT可以完成很多事情,但它仍然需要一些帮助,”微软在讨论其编程能力时提到。在为机器人控制提示LLM提出挑战时,例如提供完整而准确的问题描述,以及确定正确的可允许函数调用和API集,以及调整答案结构以偏向特定的参数,为有效地使用ChatGPT于机器应用研究人员构建了一个由以下步骤组成的流程:
首先,他们定义了一个高级功能库,该库可以针对感兴趣的情景定制,并映射到现有的低级实现中,以便ChatGPT可以推断出它们应该如何行动。
然后,他们为ChatGPT构建了一个提示符,该提示符描述了任务目标,同时标识出了可用的高级函数。此外,还包含关于约束信息或者该响应如何组织。
用户通过回路评估代码输出,要么直接分析,要么模拟,可以用自然语言反馈答案质量和安全性。
最后,当用户对生成方案感到满意时,将代码部署到实际操作上。
有几个例子展示了使用聊天来教会模型如何组合最初提供给API,以执行更复杂操作,如堆叠木块或绘制微软标志。这个模型甚至能够记住内部知识库中的SVG代码形式,然后利用学习到的技能找到现有动作来物理构建图案。
此外,研究者还尝试让这台无线电控制一架无人驾驶飞行器。一开始,他们给予该模型一个长长的提示列出所有可能编写命令来操控无线电。在之后他们发出请求指示该系统使用无线电摄像头识别饮料如椰水罐或可口可乐罐。这不仅仅是一个简单的事务,而是展示了一种全新的方式去理解并处理信息,也预示着未来科技发展的一个新纪元。