2024-12-25 科技 0
网络科技的神秘计划:HuggingGPT,一个能让ChatGPT统治所有AI模型的秘密武器?
在凹非寺丰色下,量子位公众号QbitAI发布了一篇震惊全球的技术论文——最强组合:HuggingFace ChatGPT ——
HuggingGPT,它来了!
它能帮你自动分析需要哪些AI模型,然后直接去调用HuggingFace上的相应模型,来帮你执行并完成。整个过程,你要做的就只是用自然语言将你的需求输出。
这项由浙大与微软亚研院的合作成果,一经发布就迅速爆火。英伟达AI研究科学家Jim Fan直呼:“这是我本周读到的最有意思的论文。”
它不是仅仅是一个“调包侠”,而是迈向AGI的一大步。在这个系统中,语言是通用的接口。
于是,HuggingGPT就诞生了。它工程流程分为四步:
首先,任务规划。ChatGPT将用户需求解析为任务列表,并确定任务之间执行顺序和资源依赖关系。
其次,模型选择。ChatGPT根据HuggingFace上托管专家模型描述,为每个任务分配合适模型。
接着,任务执行。混合端点(包括本地推理和HuggingFace推理)上选定的专家模型根据顺序和依赖关系执行分配任务,并给出信息和结果。
最后,由ChatGPT总结各模型日志及结果,最终输出。
假设请求生成女孩看书图片,她姿势相同于example.jpg中的男孩,并描述新图片,可以看到如何拆解并选择正确进行分析得到最终结果。
具体效果怎么样?作者采用gpt-3.5-turbo和text-davinci-003通过OpenAI API公开访问变体进行实测,在复杂情况下也表现良好,如组织音频、视频等多种形式合作完成工作。
此外,还可以集成多用户输入资源简单推理,比如三张图片中数斑马数量。此句总结:HuggingGPT在复杂任务展现良好性能项目已开源名「贾维斯」目前正在建设中,有1.4k标星。
项目名称很有意思,不叫本名,而是钢铁侠里的管家贾维斯(JARVIS)。有人发现与3月份刚发布Visual ChatGP思想非常像,但可调用的范围扩展到了更多类型。这两者都有共同作者微软亚研院,对此网友兴奋,有人表示ChatGPT成为人类创建所有AI总指挥官,也有人认为可能开启半AGI时代。但是否真的如此,我们还需观察未来发展。不过,这一工具已经引起了广泛关注,让我们期待其更大的应用潜力吧!