2024-12-12 科技 0
克雷西在凹非寺的笔下,量子位公众号QbitAI传递着科技的火花。GitHub上一个崭新的项目,能够让ChatGPT完成那些复杂而令人头疼的任务,而不仅仅是GPT3.5和GPT-4,它们都能感受到这个项目带来的力量。
它通过将问题分解成更小、更易于处理的部分,并调用外部资源来增强GPT的工作能力。这就像是在自然界中寻找隐藏在岩石缝隙中的珍宝,每一块都可能揭示出未知的事实。在调教之下,GPT-4回答的问题准确率从68%大幅提升到了85%,这是一项巨大的进步,就如同古人用智慧征服了天地一样。
我们甚至还测试了一个古老的问题——倒拔垂杨柳,这个问题似乎简单却又充满挑战性,我们给出了三个选项:诸葛亮、孙悟空和林黛玉。需要指出的是,由于目前没有获得到真正的GPT-4API,所以我们的测试只能依赖开发者的描述进行模拟。但即便如此,这也足以证明其潜力所在。
开发者使用了MMLU数据集,对比调教前后的GPT-4进行了严格的测试结果显示,未经调教前的版本只答对了68%,而经过调教后的版本则达到了85%。当然,这样的成绩还是要与真人专家平均成绩89.8%相比较才有意义。而数学方面,也选择15个大学难度的问题进行测试,即使准确率只有60%,但已经超过原版GPT40%的大幅提高。
作为SmartGPT用户,我们不需要做任何额外的事情,只需像平常一样输入我们的问题,而SmartGPT会帮助我们把问题拆分成可行的小任务,然后按照既定的步骤提交给高级的人工智能系统。在整个过程中,它会利用“let’s think step by step”这样的表述来提高回复精确度,同时也具有回溯能力,可以发现并纠正自己之前回答中的错误。
SmartGPT工作流程图清晰展示了这一过程:首先接收用户指令后进行处理拆分,并添加类似“let’s think step by step”的提示,然后将处理好的指令发送至API获取多次答案,再向API发送要求回溯答案并选择最优解最后,将最终答案展示给用户。这一切都是建立在学术论文三篇基础之上的链式提示方式、动态记忆及让LLM自我回溯以及用对话提高LLM完成度等概念上实现得更加完善。
与其他工具AutoGPT相比,Smartgpt优势体现在其逻辑链条化工作原理,使得推理能力得到显著提升。此外,由于独立子模块组合灵活,可以任意排列组合或删改配置,而且对于用户来说配置过程简洁明了,但同时也承认存在稳定性待考证,以及内存优化还有空间提升环境资源消耗方面也有待改进。不过,这只是刚起步阶段,不久前网友已经开始探讨其潜力超越预期甚至包括OpenAI公司本身的一些想法,那么你期待未来如何展现呢?
虽然当前还无法直接体验,但你可以根据项目页面提供信息,在Linux环境下搭建体验一下:
https://github.com/Cormanz/smartgpt
相关论文链接:
[1]. https://arxiv.org/abs/2305.02897
[2]. https://arxiv.org/abs/2303.11366
[3]. https://arxiv.org/abs/2303.17071
参考链接:
[1]. https://www.youtube.com/watch?v=wVzuvf9D9BU
[2]. https://www.reddit.com/r/singularity/comments/13axo1r/gpt_4_is_smarter_than_you_think_introducing/
— 完 —
下一篇:未来智造科技创新之风