GPT-4技术白皮书深度解析GPT-2样本开启AI思考新纪元

2025-01-22 科技 0

OpenAI的最新研究成果：GPT-4解析GPT-2样本，开启AI思考新纪元

科技论文范文

在人工智能（AI）领域，ChatGPT自去年11月底以来便风靡全球。据Similarweb公布的最新数据，截至今年4月，ChatGPT平台访问量达到17.6亿次，比3月份增长了12.6%，并且已达到了谷歌的2%。这些语言模型背后的大型语言模型（LLM），包含数千亿（或更多）参数，是基于大量文本数据训练而成。在提升产品销售、辅助人类决策过程中，这类AI机器学习模型能够起到很大的作用，但计算机通常不会解释它们的预测结果，而语言模型想要变得更强大，并部署更广泛，就需要研究可解释性，因为人类对模型内部工作原理的理解仍然非常有限。

站在OpenAI角度看，大型语言模型未来将和人脑一样拥有“神经元”（neurons），这些神经元会观察文本中的特定规律，并进而影响到模型本身生产的文本。因此，可解释性就是将模式能用通俗易懂的语言进行表达，把模式预测过程转化为具备逻辑关系的规则，从而通过查看模式内部来发现更多信息。

例如，如果有一个针对“漫威超级英雄”的神经元，当用户向模式提问“哪个超级英雄能力最强”时，这个神经元就会提高模块在回答中说出漫威英雄概率，或是弄清楚为什么人类神经元可以决定进行某些搜索引擎查询或访问特定网站，即逐步转化一种有数据可解释性的“无监督学习”模式。

OpenAI这次使用GPT-4来解决可解释性的问题，就是希望能够使用自动化方式，让机器提高AI数据准确性。这是其对齐研究第三支柱的一部分。该第三支柱是公司2022年发布《我们做对齐研究方法》，具体上，对齐研究将由三大支柱支持：利用人工反馈训练AI；训练系统协助人类评估；训练系统进行对齐研究。

具体到此次研究成果上，OpenAI开发了一套包含自动化工具和测试方法评估流程：首先，将GPT-2运行文本序列等待某个特定激活情况发生；然后，让 GPT-4 针对一段文本生成解释，如通过接收到的文本和激活情况判断漫威是否与电影、角色和娱乐有关；随后，用 GPT-4 模拟 GPT-2 的行为预测接下来会做什么，然后评估打分，对比模拟后的结果与真实行为得分，在下图这个例子中,GTP 4 的得分为0.34。使用上述评分方法，开始衡量他们技术对于网络不同部分效果，并尝试针对目前不清楚的情况改进技术。此外，他们还发现，有超过1000个神经单元得分至少为0.8分，这意味着当前的大型语言模型已经可以理解很多概念，同时目前理解概念似乎与人类不太相同。

该团队称希望随着技术和研究方法改进进一步提高AI可解释性能力：如迭代解释，可以让 GTP - 5 想出可能反例根据激活情况修改; 使用更大的版本作出; 以及调整已被讲述过的话题结构等，用不同的激活函数训练以帮助提升计费功能。

然而，该团队也承认存在局限性，如当前生成的情景还不完美，其中包括复杂行为无法简短自然描述，以及整个过程算力消耗极大等。

最终，希望这种方式能形成、测试并迭代完全一般假设，从而比肩人类大脑想法和行为，以及将其作为在部署前后检测偏差安全问题的一个办法。而为了实现这一目标，还有很长路要走。

"我们希望这将开辟一条有前途途径。”Jeff Wu表示，此技术可以让其他人构建并贡献自动方案，以解决 AI 模型可见性问题，使之好地说明这些行为，比如如何影响人的思维等。（文章首发钛媒体App,作者林志佳）

标签：手抄报科技主题、两弹一星之父到底是谁、小学生科技小制作、科技成果转化、谈谈科技发展与社会生活

上一篇：别墅生活翠绿山谷中的现代艺术殿堂

下一篇：人防设计的实用性与艺术性探究

GPT-4技术白皮书深度解析GPT-2样本开启AI思考新纪元

数码之家 - 无线监控难道不是这里让您的生活更安全吗

华为nova11系列如同一位慷慨的贵宾正式开售于来迪信通购机之人将享受8重优惠这或许是2023年最适

申请报告之美从枯燥到绚烂的格式变革

在宁静的自然环境中惠威M200以其高颜值和出色的音质为数码宝贝1国语版免费观看提供了完美的伴奏这个超

主题我去过中国最大的服装批发市场啦