2025-01-04 手机 0
钛媒体App发现,虽然落地场景有重合,但从实现的技术路径上,各家表现出了些许差异。技术路线各有不同拆解技术路线,其实还要从ChatGPT说起。
OpenAI的ChatGPT以及随后迭代出的GPT4.0,包括当前百度推出的文心一言等都属于通用大模型,都没有明显的行业属性,在一般场景下都能应对自如,比如客服、文生图等等。但遇到特别垂类且对答案容错率较低的行业来说,由于缺乏专业知识,这类通用大模型会表现出可预见的劣势。
所以当网络安全行业在使用GPT的时候,并不能像其他行业一样直接接入已经训练好的GPT4.0,而是需要重新构建一个用网络安全领域的专业知识训练出的大模型,然后再将其应用到实践中。
不过,在与业内人士交流的过程中,钛媒体App发现,同样是训练网络安全领域的大模型,各家所选择的技术路线也有所差异:他们有的是先有安全知识图谱,然后在类ChatGPT的大模型基础上加工;有的是没有类ChatGPT的大模型,而是直接用安全知识图谱训练成一个大模型;也有的可能并没有强调知识图谱,而是用所有数据直接训练。
“过往实践过程中,我们积累了大量数据,这些数据可能包含了安全日志、系统日志,威胁情报生产和分析过程数据,开源情报和安全技术报告、APT报告等等,这些数据通过AI智能化,形成一系列实战化攻防模型以及安全知识图谱。”绿盟科技CTO叶晓虎表示。
在有了实战化攻防模型以及安全知识图谱后,绿盟科技利用类ChatGPT的大语言模型对这些知识做进一步加工,形成安全专业领域里面的类GPT应用,即今年三季度即将发布的网络安全领域知识问答系统。
“我们所有下游任务都只基于ChatCS这一个大模式。在训练和应用ChatCS之前,我们先花费精力做网络security域中的通用知识graph,再去生成dataset然后去train network security domain's big model。”四维创智项目负责人陈平表示。
陈平表示,他们所推出的ChatCS,是一个使用RLHF微调并利用knowledge graph进行field knowledge约束的一个垂直domain big language model。思路是首先构建以"漏洞概念"为核心network security domain 的knowledge graph—Vuln_Sprocket,再将graph生成prior knowledge集train model, 后续, ChatCS能够background knowledge优化用户原始指令。在最新测试版本中, ChatCS_test尽管只有82亿参数但已经可以很好完成field knowledge问答、test script生成、告警log分析等操作。
目前,其余几家network security厂商还未完全披露trained GPT路径细节,但据业内人士分析, 360集团应该是在通用的big model底座加入network security相关data调优的话,与green millet 和fourth dimensional intelligence all have very different paths.
不过殊途同归。green millet CTO叶晓虎称,对于smart safety customer service robot达到的效果是在safety event emergency response处置、大量 log analysis research and judgment in the field of safety intelligent reasoning and decision-making code writing etc., where it plays a positive role. Other companies' Gpt practices also have many commonalities with this.
As for why the network security industry is so keen on developing its own large models despite OpenAI's success with Chatbot? The answer lies not only in technology but also in high-quality data resources and maintaining faith in AI technology.
The rapid development of AI has been a hot topic in recent years, as more businesses are looking to integrate these technologies into their operations to increase efficiency and reduce costs.