2024-12-12 科技 0
克雷西,作为一名技术探索者,我将以我的视角重新阐述这个GitHub新项目的魅力。这不仅是一个提升ChatGPT工作能力的神奇工具,它甚至能够让GPT3.5和GPT-4都支持复杂任务。通过巧妙地拆解问题并调用外部资源,这个项目显著增强了GPT的功能。
在它的精心调教下,GPT-4原本68%的回答准确率竟然飙升至85%。我们还测试了一个有趣的问题——关于倒拔垂杨柳——并提供了三个选项:诸葛亮、孙悟空和林黛玉。在没有实际使用到GPT-4API的情况下,我们依靠开发者的介绍方法进行手工模拟测试。
当然,这样的个体测试不能完全代表其整体表现,因此我们需要更广泛数据集来进行全面的评估。开发者利用MMLU数据集对调教前后的GPT-4进行了详细分析,结果显示未经调教版本只答对68%,而经过调教后的版本则达到了85%。
此外,在数学领域中,也同样使用MMLU数据集进行测试,其中选择了15个大学难度问题。虽然答案正确率为60%,但已经超过原版GPT40%以上。这表明SmartGPT在提高工作效率方面取得了一定的进步。
为了形象地描述SmartGPT中的环节,我们可以把用户比作“甲方”,任务拆分成高级子任务并逐一汇报给“老板”;而“员工”则负责编写伪代码,并交由“小黄人”执行优化LUA脚本。此过程简便易行,只需像使用普通Chat GPT一样输入问题,而不需要额外指令。
Smart Gpt 的两个核心特性是能否加入"let's think step by step"这样的表述来提高回复准确率,以及拥有回溯能力,即能够发现并指出自己之前回答中的错误。这两点极大地增强了其工作流程图所展示出的智能处理能力。
最后,由于三篇学术论文的启发(白框内内容),包括链式提示方式、动态记忆及让LLM自我回溯以及用对话提高LLM完成度等,Smart Gpt 在推理能力上胜过其他类似工具,如Auto Gpt。而且由于其组合性,可以任意排列、组合或删改,每个人都可以根据自己的需求定制配置过程,使之更加简单易用。不过,由于项目刚刚推出,不稳定性仍需进一步验证,并且存在内存优化和环境资源消耗上的不足之处。