2024-06-29 行业资讯 1
“大模型怎么融进人形机器人里?”这是庞建新最近一直在琢磨的核心问题。 作为优必选副总裁、研究院副院长,庞建新正领导团队,将大模型技术应用于人形机器人的多模态感知和决策规划中,提升人形机器人智能化水平。 在从业的近三十年里,他的专业背景横跨语音处理、计算机视觉,再到人形机器人技术;从中科大的博士,到中国科学院深圳先进技术研究院的PI,再到优必选的技术高管,他的职业生涯,已然是中国智能科技崛起的一个缩影。 现如今,大模型的横空出世,除了让庞建新看到了一些可能性,更多是冷静。 他坦陈,“因为在技术快速发展时,整个技术路线和应用场景还存在不确定性,但同时也正是国内人形机器人企业快速发展的最佳时期。” 这是一种强烈的矛盾感。 在谈及大模型技术对人形机器人智能化进程的影响时,庞建新提出了自己的见解。 他认为,大模型技术的核心是其能够融合大量知识和数据,这对于人形机器人领域来说是一个巨大的机遇,但同时也带来了新的挑战。比如如何将大语言模型技术(可理解为“大脑”)与人形机器人的“小脑”(控制大模型)和“本体”结合,以及如何处理大语言模型可能产生的“幻觉”问题等等。 而要落到实际操作层面,庞建新表示,优必选的策略是双管齐下,既要一种分层结构的解决方案,同时也不能放弃端到端的解决方案。 前者是将大模型分为处理知识、常识推理的“大脑”层,指导动作规划的“小脑”层,以及直接与控制相结合的动作执行层。这种分层解耦的方法,使得每一层都可以专注于其特定的任务和数据需求,提高了技术的应用效率。 后者则是从感知直接到控制的全过程,这种方法导致数据获取更为复杂,却能够提供更为直接的解决方案。 针对大模型与机器人智能化现状,庞建新说了四个字:百花齐放。 “当下人工智能和人形机器人技术的结合正处于一个开放性问题的时期。”这正是当下人形机器人从业者的乐趣所在。而换句话说,这也意味着目前技术尚未开始收敛,仍需在一些小规模场景中进行实验和测试。 今年2月,优必选与新能源车厂的合作,正是他们在多模态感知决策技术应用实训方面的一次尝试。庞建新坚信,大模型技术将是推动未来技术进步和产业化的关键。 近期在与