当前位置: 首页 - 科技 - GPT-4革新AI思考解析GPT-2样本的科技进步

GPT-4革新AI思考解析GPT-2样本的科技进步

2025-01-22 科技 0

科技改变生活:GPT-4解析GPT-2样本开启AI思考之门

在去年11月底至今,人工智能(AI)聊天机器模型ChatGPT风靡全球。据Similarweb公布的最新数据,截至今年4月,ChatGPT平台访问量达到17.6亿次,比3月份增长了12.6%,同时已达到谷歌的2%。

ChatGPT背后的大型语言模型(LLM),是基于大量文本数据训练、包含数千亿(或更多)参数的语言模型。在大数据时代,这类 AI 机器学习模型可以在提升产品销售、辅助人类决策过程中能够起到很大的作用,但是计算机通常不会解释它们的预测结果,而语言模型想要变得更强大,部署更广泛,就需要研究可解释性(interpretability),因为人类对模型内部工作原理的理解仍然非常有限。

站在OpenAI 的角度看,大模型未来将和人脑一样拥有“神经元”(neurons),这些神经元会观察文本中的特定规律,进而影响到模型本身生产的文本。所以可解释性就是将模型能用通俗易懂的语言进行表达,把 모델预测过程转化成具备逻辑关系的规则能力,从而通过查看模式内部来发现更多信息。

例如,如果有一个针对“漫威超级英雄”的神经元,当用户向模式提问“哪个超级英雄能力最强”时,这个神经元就会提高模式在回答中说出漫威英雄概率或者弄清楚为什么人类神经元,可以决定进行某些搜索引擎查询或访问特定网站,即逐步转化一种有数据可解释性的“无监督学习”模式。

OpenAI这次使用GPT-4来解决可解释性的问题,就是希望能够使用自动化方式,让机器提高 AI 数据准确性,将其作为其对齐研究第三支柱的一部分。具体到本次研究成果上,OpenAI 开发了一套包含自动化工具和测试方法评估流程:首先让 GPT-2 运行文本序列等待某个特定神经元被频繁激活;然后让 GPT-4 针对一段文本生成解释;随后用 GPT-4 模拟 GTP-2 真实激活情况判断漫威是否与电影、角色和娱乐有关;最后评估打分,对比模拟结果与真实结果准确度,在下图这个例子中,得分为0.34。

使用上述评分方法,上述技术开始衡量他们技术不同网络部分效果,并尝试针对目前不清楚部分改进技术。OpenAI 表示,他们正在将 GTP-4 编写了所有307,200 个激活情况并提供给学术界开发新的技术以提升得分。此外,还发现超过1000 个激活条件得分至少为0.8 分,这意味着模块可以理解多数人类行为,同时目前模块理解概念似乎和人类不太相同。

该团队称希望随着技术和研究方法改进进一步提高 AI 模型可解释性能力,如迭代解释使模块根据激活情况修改描述;使用更大的模块作出描述;调整已描述结构等,用不同的函数训练有助于提高描述评分。而对于局限性,如当前还不完美地生成描述尤其是在比 GTP 更大的model时表现差劲,以及复杂行为无法简短自然语言描述等,都表示期待未来的工作能解决这些问题。

最终,该团队希望利用这种方式形成测试并迭代完全一般假设,从而比肩人类大脑想法行为,以及将其大model 解读为部署前后检测平衡安全问题的一种方法。不过,在此之前,有很多路要走。

"我们希望这将开辟一条有前途途径。”Jeff Wu 表示这一技术可以让其他人构建并贡献自动化方案,从而解决 AI 模型可视化问题,使人们了解如何影响人的思维以及由此产生的问题。(钛媒体App首发文章作者|林志佳)

标签: 科技小论文500字发明家三四年级手工科技小制作深圳科技有限公司最新科技动态