2025-01-04 手机 0
在网络安全领域,ChatGPT的应用正在逐步展开。从各大公司推出的GPT落地方案来看,大多数都是针对安全事件响应、漏洞挖掘和风险评估等场景。不过,在与业内专家交流时,我们发现,每家公司在技术路径上都有自己的差异。
OpenAI的ChatGPT以及后续版本的GPT 4.0,以及百度推出的大型语言模型文心一言,都属于通用大模型,它们没有明显行业属性,可以应对各种常见任务,如客服、图像生成等。但是,当它们应用到特定行业特别是网络安全时,由于缺乏专业知识,这些模型就表现出了不足。
因此,在网络安全领域使用这些大型语言模型并不能像其他行业那样直接使用已经训练好的模型,而需要重新构建一个专门用于网络安全领域的大型语言模型,然后再将其应用到实际工作中。
我们通过与业界人士的交流发现,即使同样是在网络安全领域训练大型语言模型,每家的选择和处理方式也不尽相同:有的先建立了一个关于网络安全知识的图谱,然后在类似ChatGPT的大型语言模型基础上进行加工;有的则直接用这个图谱来训练一个大的新型语言模型;而有的则可能不太强调这个图谱,而是将所有数据直接用于训练。
绿盟科技CTO叶晓虎提到了他们积累了大量相关数据,这些数据包括了日志记录、威胁情报分析过程中的数据以及开源情报和APT报告等。这些数据经过AI智能化处理形成了一系列实战化攻防模式以及知识图谱,并且利用类似ChatGPT的大型语言模型进一步加工,形成了一套专门针对网络安全问题的问题答疑系统。
四维创智的人工智能项目负责人陈平表示,他们所推出的ChatCS是一个使用RLHF技术微调并利用知识图谱进行字段约束的垂直领域大型语言模型。他们首先构建了一张以“漏洞概念”为核心的网络安全领域知识图谱—Vuln_Sprocket,再将该图谱生成的一组先验知识集用于训练模块,最后通过优化用户原始指令背景信息,使得ChatCS能够完成问答、测试脚本生成及告警日志分析等操作。
目前,还有一些其他厂商尚未完全公开他们如何训练这些大型语言模式,但据业内分析,360集团可能会采用一种不同的路径,比如基于通用大类型底座加入更多特定的网安相关数据进行调整。这也显示出每个企业都有自己独特的解决方案,但最终目标是一致的——探索这项技术带来的潜力变革。
值得注意的是,这场竞赛仅仅才刚刚开始。在短短三个月里,许多公司迅速行动起来,将他们积累已久的事实证据纳入算法中。然而,有几个关键问题仍然悬而未决:为什么当OpenAI发布这一革命性工具后,直到现在才有人关注它?是否因为高质量的事实证据难以获取?还是因为持续更新信仰和坚持长期培养这种能力?
一些创业者表示,他们之前尝试过自动化但没有成功,因为chatgpt证明这是可行之路,现在大家才敢于投入更多资源。而另一些人认为,如果能成功实现智能推理和决策,那么未来面临挑战或攻击方式将会发生根本性的变化,从经验依赖转向更标准化、高效率方法。这只是起点,一场长跑即将拉开帷幕。(本文首发钛媒体APP)