2025-01-04 手机 0
在ChatGPT的引领下,网络安全领域正在逐步融入这一革命性技术。从各家公司发布的应用落地方面来看,大多数都聚焦于安全事件响应、漏洞挖掘和风险评估等领域。不过,在与行业专家的深入交流中,我们发现,每个公司在将ChatGPT应用于网络安全时,都采用了不同的技术路径。
OpenAI的ChatGPT以及随后的改进版本,如百度推出的文心一言,它们都是通用的大型语言模型,没有特定的行业属性。在大多数场景下,这些模型表现出色,但当遇到需要高度专业知识和容错率较高的特殊行业时,它们就会显得力不从心。
因此,当网络安全企业使用这些模型时,他们不能像其他行业那样直接使用预先训练好的模型,而是需要构建一个专门用于网络安全领域的大型语言模型,并将其应用于实际工作中。
尽管如此,每家公司在训练这样的大型语言模型时,都选择了不同的方法:有的首先建立了一个包含大量网络安全知识图谱的大型语言模型;有的则没有使用类似的图谱,而是直接利用所有数据进行训练;还有些公司可能没有强调知识图谱,而是依赖所有数据进行训练。
“我们积累了一系列实战化攻防模拟,以及相关的安全知识图谱。”绿盟科技CTO叶晓虎表示,“然后,我们利用类似ChatGPT的大型语言模型对这些信息进行进一步加工,以创建适用于网络安全领域的一个问答系统。”
四维创智的人工智能项目负责人陈平提到了他们开发的一款名为ChatCS的大型语言模型,该产品通过RLHF技术微调,并结合了专业知识约束。“我们的目标是在‘漏洞概念’基础上构建一个网络安全领域的通用知识图谱,然后再用这个图谱作为前置条件去训练我们的大型语言模型。”陈平解释道。最新测试版本虽然只有82亿参数,但已经能够很好地执行诸如问答、脚本生成以及日志分析等任务。
尽管还有一些其他厂商尚未公开详细说明他们如何处理这种问题,但根据业内人的分析,360集团可能会采取一种不同于绿盟科技和四维创智的方法,即以通用的大型语言模型为基础,再加入一些特定数据进行优化。
然而,不管每家公司走的是怎样的路线,最终目标都是相同的——利用这种新兴技术来提高效率并解决复杂的问题。这也是一场长跑,自ChatGPT爆红以来,只有短短几个月时间,就有许多企业开始投入这项技术。但值得思考的问题之一是,为何直到OpenAI成功后,才有人意识到大规模应用这些工具带来的变革?
原因可能在于,对待大型机器学习来说,关键并不仅仅是一个简单的问题而已。问题既包括获取高质量且相关性的数据,也包括保持对人工智能信仰以及持续不断地更新和完善这些工具的心态思维。
“之前只是尝试过一些小范围内的小规模尝试,但因为一次次失败就放弃了。但现在,由此可以看到这是可行之路,所以大家才敢更大的投入。”一位创业者表达了他的观点。
除了证明这一概念有效,大型机器学习也传递着另一个重要信息,那就是它们确实能改变对抗策略底层逻辑。如果能把智能推理和决策正确运用,那么这种方式就可以转变成一种范式,从经验依赖转向系统化工作。而以前,这种经验存在于人类脑海里无法复制,但是如果这样做的话,将会带来巨大的变化。