2025-01-04 科技 0
在网络安全领域,ChatGPT的应用正在逐步展开。从各大公司推出的GPT落地方案来看,大多数都是针对安全事件响应、漏洞挖掘和风险评估等场景。不过,在与业内专家交流时,我们发现,每家公司在技术路径上都有自己的差异。
OpenAI的ChatGPT以及其后续版本GPT4.0,以及现在百度推出的大型语言模型文心一言,都属于通用大模型,它们没有明显的行业属性,能够适应广泛的场景,如客服、图像生成等。但是,对于某些特定行业且对答案容错率较低的领域,这类通用大模型就显得力不从心了。
因此,当网络安全行业使用GPT时,并不能简单地将现成的大型语言模型直接应用,而需要构建一个专门针对网络安全领域知识训练的大型语言模型,然后再将其用于实践中。
然而,不同公司在训练这样的网络安全领域的大型语言模型时,选择的技术路线也有所不同:有的先建立了安全知识图谱,再基于类似ChatGPT的大型语言模型进行加工;有的则直接利用这些数据训练成一个大型语言模型;还有可能完全忽略知识图谱,只依赖所有数据进行训练。
绿盟科技CTO叶晓虎表示:“我们积累了大量相关数据,这些数据包含了安全日志、系统日志、威胁情报生产和分析过程数据,以及开源情报和APT报告等。通过AI智能化,我们形成了一系列实战化攻防模式以及安全知识图谱。”之后,他们利用类似ChatGPT的大型语言模型对这些知识进行进一步加工,从而开发出了即将发布的一款网络安全问答系统。
四维创智的人工智能项目负责人陈平表示:“我们的下游任务只基于一个叫做ChatCS的大型语言模型。在训练和应用这个大型语言之前,我们首先花费精力构建了一个针对于网络安全领域的通用知识图谱,然后利用该图谱生成异构数据集再去训练网安领域的大型语料库。”
尽管其他几家企业尚未公开详细说明他们如何使用或调整这项技术,但据业内人士分析,360集团似乎采取的是以通用大模式为基础,然后加入特定网络 安全相关数据调优的方法,与绿盟科技及四维创智有很大的不同。
尽管如此,由于短时间内就能快速上马并且取得效果,这也表明自ChatGPT火爆以来仅过去100余天左右,就已经引起了广泛关注。这也是值得思考的问题之一:既然这种变革如此迫切,为何直到OpenAI成功后才有人开始关注?
原因可能在于,对于这种新兴技术来说,其最主要的问题不仅仅是技术本身,还包括高质量的事故语料库,更重要的是保持持续更新信仰以及不断微调的心态思维。“之前尝试过一些小规模自动化,但没想到这样的事情可以行得通,所以大家才敢投入更多资源。”一位创业者如是说。
除了验证这一点,大规模学习确实带来了可能性,即改变底层逻辑上的抗争方式。“如果我们能够把这个想法付诸实际,那么它会彻底改变我们的工作方式,让经验从人的头脑转移到机器中。”叶晓虎指出。