2025-03-08 数码 0
在中国十年的巨变中,我们见证了科技的飞速发展,尤其是人工智能领域。Auto-GPT作为一款AI工具,它不仅展示了AI技术的成就,也暴露了当前AI面临的一些挑战。本文将详细介绍Auto-GPT实测报告,并探讨它虽然不完美,但却是最有前景的AI路线。
首先,我们来看一下Auto-GPT在电视盒子信息分析方面的表现。尽管它找到了所需数据并提供了Top5电视盒子的参数和价格,但却没有列出数据来源和评判标准。此外,没有进行市场分析,只是一味列出数据和配置,没有对收集到的数据进行额外分析。这表明虽然Auto-GPT降低了对Prompt的依赖性,但仍然要求较高的初始任务描述详细性。
接下来,我们将测试第二个任务:自动写作。在这个测试中,Auto-GPT被定义为作家,要求撰写一个赛博朋克背景下的科幻小说大纲。令人惊喜的是,Auto-GPT完成得非常出色,不仅生成了一系列文件,如“赛博朋克大纲”、“对话”、“赛博朋克调查”等,每份文件都详实记下了内容,而且每个内容都是基于同一个世界观下生成的。这种长期记忆功能帮助Auto-GPT保持在相同背景设定里,而不会偏离。这一点已经能够说是在“创作”一些新文字。
然而,在实际应用中,还存在几个问题。一方面,由于GPT-4单个token价格远高于GPT-3.5,所以即使是在理想状况下,一次任务也需要花费数百元,这对于大规模应用来说是不切实际的。此外,常见死循环现象也是一个严重的问题。一旦遇到GPT-4无法处理的问题,就会陷入自我循环,每一步执行后的动作都是“do_nothing”,而且下一个动作仍然如此,这造成大量资源浪费。而且目前还没有有效解决方案。
此外,还有执行速度过慢的问题。在本次统计Top5电视盒子的过程中,耗时8分钟进行20个steps完成总结,而其他联网AI工具如New Bing则可以在8秒内完成同样的任务,并提供参考链接供读者自行参考,比起Auto-GPT更加直观。
最后,本文总结指出AGI,即通用人工智能,最重要的一个特点就是脱离人工监督可自行完成任务,并且可以完成一些“创意任务”。通过主任务生成子任务(或称子智能体)的方法,让AI通过LLM脱离人类监督自行完成任务可能是未来的发展方向之一。不过目前的问题是LLM能力还是比较弱,对当前状态把握还不够好,从而经常让自己陷入死循环需要人类介入。而且虽然向量数据库赋予了AI中长期记忆可能性,但是对于后续任务缺乏继续沿用此前的记忆能力。此外,执行速率也可以通过调整架构提升,如将逐项执行转换为异步同时执行模式,大幅提升效率。
综上所述,即便现在还有许多挑战和不足之处,但我们相信随着技术不断进步,这种自动生成子智能体的AI会进一步发展,为复杂问题提供一种全新的解决方案。