当前位置: 首页 - 科技 - 挖掘GPT的隐藏实力展示中国科技进步的自然力量

挖掘GPT的隐藏实力展示中国科技进步的自然力量

2024-12-12 科技 0

克雷西在凹非寺的量子位公众号QbitAI发布了一篇文章,介绍了一个名为SmartGPT的GitHub新项目。这个项目能够让ChatGPT完成复杂任务,并且支持GPT3.5和GPT-4。它通过将问题拆解并调用外部资源来提高GPT的工作能力。在经过调教之后,GPT-4回答的准确率从68%提高到了85%。

开发者使用了MMLU数据集对调教前后的GPT-4进行了测试。结果显示,未经调教的版本只答对了68%,而调教后的版本答对了85%。数学方面,同样使用MMLU数据集进行测试,开发者从中选择了15个大学难度的问题。虽然准确率只有60%,但也是及格,而且比原版GPT的40%已经好了太多。

SmartGPT中的环节形象地被比作职场中的角色,其中“甲方”是用户,“经理”将任务拆分给“老板”,然后由“员工”编写伪代码交给“小黄人”执行。而作为用户,只需要像使用普通GPT一样输入问题,而不必给出额外指令。

此前有人发现,在输入给GPT的指令中加入"let's think step by step"可以提高回复的准确率。此外,SmartGPT还具有回溯能力,可以发现并指出自己此前回答中的错误。这两个特性为其工作提供了重要支撑。

SmartGpt工作流程图展示了解决方案,它会处理用户输入、添加类似表述、传递至API、重复获取不同答案,并最终展示最佳答案给用户。这一过程受到了三篇学术论文启发,这些论文分别涉及链式提示方式、动态记忆及LLM自我回溯,以及用对话提升LLM完成度。

与其他工具相比,比如AutoGPTR等工具优化方法不同的是,其强大的推理能力来源于形成逻辑链条。不过,由于项目刚推出,不稳定性有待考证,还存在内存优化和环境资源消耗方面的问题。但许多读者期待着未来可能出现更多惊喜,也希望看到OpenAI自身对于这些潜力的一种认可。如果你感兴趣,可以访问以下链接查看详细信息:

https://github.com/Cormanz/smartgpt

相关文献:

[1]. https://arxiv.org/abs/2305.02897

[2]. https://arxiv.org/abs/2303.11366

[3]. https://arxiv.org/abs/2303.17071

参考链接:

[1]. https://www.youtube.com/watch?v=wVzuvf9D9BU

[2]. https://www.reddit.com/r/singularity/comments/13axo1r/gpt_4_is_smarter_than_you_think_introducing/

— 完 —

标签: 牙签发射器小学生科技作品我国科技新成果科技战争黑科技软件社区