当前位置: 首页 - 科技 - GPT-4革新科技传承解析GPT-2样本开启AI思考之门的重要研究成果

GPT-4革新科技传承解析GPT-2样本开启AI思考之门的重要研究成果

2025-01-22 科技 0

在去年11月底至今,人工智能(AI)聊天机器模型ChatGPT风靡全球。根据Similarweb公布的最新数据,截至今年4月,ChatGPT平台访问量达到17.6亿次,比3月份增长了12.6%,同时已达到谷歌的2%。

这些大型语言模型(LLM),是基于大量文本数据训练、包含数千亿(或更多)参数的语言模型。在大数据时代,这类 AI 机器学习模型可以在提升产品销售、辅助人类决策过程中能够起到很大的作用,但是计算机通常不会解释它们的预测结果,而语言模型想要变得更强大,部署更广泛,就需要研究可解释性(interpretability),因为人类对模型内部工作原理的理解仍然非常有限。

站在OpenAI 的角度看,大模型未来将和人脑一样拥有“神经元”(neurons),这些神经元会观察文本中的特定规律,进而影响到模型本身生产的文本。所以可解释性就是将模型能用通俗易懂的语言进行表达,把模式预测过程转化成具备逻辑关系的规则能力,从而通过查看模式内部来发现更多信息。

例如,如果有一个针对“漫威超级英雄”的神经元,当用户向模式提问“哪个超级英雄最强”时,这个神经元就会提高模式在回答中说出漫威英雄概率或者弄清楚为什么人类神经元,可以决定进行某些搜索引擎查询或访问特定网站,即逐步转化一种有数据可解释性的“无监督学习”模式。

OpenAI这次使用GPT-4来解决可解释性的问题,就是希望能够使用自动化方式,让机器提高 AI 数据准确性,是其对齐研究第三支柱的一部分。据悉,“第三支柱”是公司2022年发布《我们做对齐研究方法》,具体对齐研究将由三大支柱支持:利用人工反馈训练 AI;训练 AI 系统协助人类评估;训练 AI 系统进行对齐研究。

具体到这次研究成果上,OpenAI 开发了一套包含自动化工具和测试方法评估流程:首先,将 GPT-2 运行文本序列等待某个特定神经元被频繁激活;然后让 GPT-4 针对一段文本生成解释,如通过 GPT-4 接收到的文本和激活情况判断漫威是否与电影、角色和娱乐有关;随后用 GPT-4 模拟 GPT-2 神经子接下来会做什么,并预测行为;最后评估打分,对比 GTP-4 模拟神经子与真实神经子的结果准确度,在下图这个例子中,得分为0.34。使用上述评分方法,OpenAI 开始衡量他们技术网络不同部分效果并尝试针对目前不清晰部分改进技术。

OpenAI 表示,他们正在将 GTP 编写过所有307,200个神经子的说明集和可视化工具开源,同时还提供了 OpenAPI 公开代码用于开发者测试自己的方案,以此促进学术界进一步提升AIGP 解释能力。此外,该团队发现,有超过1000个激活值高于0.8分,这意味着至少有一半的人类思维活动已经被系统识别出来,并且他们认为随着技术改进,他们希望能继续探索如何更好地理解复杂思想流程以及如何更加有效地执行任务以实现这一目标。

尽管如此,对于当前面临的问题—即现有的技术无法完美地理解复杂行为,以及尚未完全解决诸如算力消耗等挑战—该团队表示愿意继续努力并寻找创新解决方案。这项工作对于开放来源社区来说是一个巨大的贡献,因为它使得其他科学家能够构建新的自动化系统以检测并纠正潜在偏见或欺骗内容,同时提高整个领域关于语义理解深度知识共享水平。

"我们希望这是一个前途光明的人生旅程。”Jeff Wu 表示,“这一技术可以让其他人构建出自动方案,从而解决 AIGP 可解释性问题,并比现在更好地了解这些 AIGP 行为,比如 AIGP 如何影响人类的大脑中的每一个细胞。”

标签: 科普小故事风力发电青岛科技大学大学生科技创新项目有哪些最新科技部名单