2024-12-12 科技 0
克雷西在凹非寺的量子位公众号QbitAI发布了一篇文章,介绍了一个名为SmartGPT的GitHub新项目。这个项目能够让ChatGPT完成复杂任务,并且支持GPT3.5和GPT-4。它通过将问题拆解并调用外部资源,提高了GPT的工作能力。在经过调教后,GPT-4回答的准确率从68%提高到了85%。
开发者使用MMLU数据集对调教前后的GPT-4进行了测试。结果显示,未经调教的版本只答对了68%,而调教后的版本答对了85%。数学方面,也使用MMLU数据集进行测试,虽然准确率只有60%,但比原版GPT40%好。
文章还提到SmartGPT中的环节形象地比作职场中的角色,如“甲方”、“经理”、“老板”和“员工”。作为用户,只需像使用普通GPT一样输入问题,而不必给出额外指令。SmartGPT会帮助用户把问题拆分,然后按照步骤提交给GPT。
此前有人发现,在输入给GPT的指令中加入“let’s think step by step”可以提高回复的准确率。而且,GPT-4具有回溯能力,可以发现并指出自己此前回答中的错误。这两个特性为SmartGpt提供了重要支撑。
文章最后提到尽管Smartgpt目前暂无开箱可用版本,但需要自行在Linux环境搭建,有动手能力强的读者可根据项目页面中的指示体验。此外,还有三个学术论文是其工作原理的一部分,这些论文分别关于“链式提示方式”,“动态记忆及让LLM自我回溯”,以及“用对话提高LLM完成度”。
总之,Smartgpt通过将任务进行拆分形成逻辑链条,因此拥有更强大的推理能力,而且实用性上也更加简单易于配置。但是,由于刚推出不久,所以稳定性有待考证,在内存优化方面还有所欠缺,对环境资源消耗也更多。不过,有网友表示我们低估了gpt潜力,即使包括openai自己。这篇文章引发了一些讨论,让人期待gpt未来的表现,并且对于如何利用这些工具提升自己的知识水平产生思考。