2025-01-04 手机 0
网络安全领域类ChatGPT应用
从各家披露的GPT落地方向来看,大部分都是面向安全事件响应、漏洞挖掘、风险研判等场景。不过,在与业内人士交流的过程中,钛媒体App发现,虽然落地场景有重合,但从实现的技术路径上,各家表现出了些许差异。技术路线各有不同拆解技术路线,其实还要从ChatGPT说起。
OpenAI的ChatGPT以及随后迭代出的GPT4.0,以及百度推出的文心一言,都属于通用大模型,都没有明显的行业属性,在一般场景下都能应对自如,比如客服、文生图等等。但遇到特别垂类且对答案容错率较低的行业,这类通用大模型会表现出可预见的劣势。
所以当网络安全行业在使用GPT的时候,并不能像其他行业一样直接接入已经训练好的GPT4.0,而是需要重新构建一个用网络安全领域的专业知识训练出的大模型,然后再将其应用到实践中。
不过,在与业内人士交流的过程中,钛媒体App发现,同样是训练网络安全领域的大模型,每家的所选择的技术路线也有所差异:他们有的是先有安全知识图谱,然后在类ChatGPT的大模型基础上加工;有的则直接用这些数据直接训练一个大模型;也有的可能并没有强调知识图谱,而是用所有数据直接训练。
“过往实践过程中,我们积累了大量数据,这些数据可能包含了安全日志、系统日志,威胁情报生产和分析过程数据开源情报和安全技术报告、APT报告等等,这些数据通过AI智能化形成了一系列实战化攻防模型以及安全知识图谱。”绿盟科技CTO叶晓虎表示。
在有了实战化攻防模型以及安全知识图谱后,将利用类似于ChatCS的大语言模式进行进一步加工,以此形成更为专门针对网络攻击防御的问题答疑系统,即今年三季度即将发布的人工智能问答系统。
绿盟科技项目负责人陈平表示,他们推出的ChatCS,是一个使用RLHF微调并利用知识图谱进行领域知識约束的一种垂直领域大的语言模式。思路是首先构建以“漏洞概念”为核心的一套关于网络攻击防御方面的问题数据库—Vuln_Sprocket,再将问题库生成先验问题集用于作为学习材料去训练该类型的问题回答机器。之后,该机器能够基于背景信息优化用户原始指令。在最新测试版本里,即便只有82亿参数,也能很好地完成问答任务及自动编写代码。
目前其余几家公司还未完全披露如何具体操作这款产品,但据业界分析者们认为,一些企业像是360集团,他们应该是在一种基础上的通用的语言处理框架之上加上了特定的针对性培训,让它更加适合做一些关于保护计算机免受恶意软件侵害的事情。而这种方法,与绿盟科技和四维创智采用的手法截然不同。
不过殊途同归。大多数公司提供或正在开发的人工智能工具,如客户服务机器人,对于处理海量日志文件中的潜在威胁或者快速检测异常行为非常有效。这意味着不管每个公司采取什么样的策略,它们最终都达到了相同目的——提高效率和精确性。
然而,就算如此发展,有几个关键问题仍旧悬而未决:既然我们知道人们对于这些高级工具感到兴奋,并且它们似乎可以帮助解决许多复杂问题,那为什么直到现在才有人开始探索这一趋势?
原因可能就在于,对于高级聊天机器来说,不仅仅是一个简单的问题,它涉及到两个主要挑战:首先,我们必须收集足够数量、高质量的话题语料;第二,我们必须保持信念,同时不断更新我们的理解,使得我们能够根据新的信息调整我们的行动计划。
除了试错成功,大型聊天平台带来的另一个重要迹象就是,它们似乎已经准备好改变整个行业工作方式。“如果我们真的掌握了让这个工具真正发挥作用,那么这就改变一切,从过去经验式学习转变成一种全新的范式。”叶晓虎补充道。他提到的范式变化实际上意味着以前人类只能通过记忆存储经验,现在可以通过使用计算设备来实现更快捷更准确地获取信息,从而提升工作效率。此外,他还指出,如果这种情况发生,那么未来的人力资源需求就会发生根本性的变化,因为许多技能会被替代,而新技能却难以预测或准备之早期阶段。
因此,当你考虑一下这是长远的一个游戏时,你会明白为什么尽管很多企业急切想要参与进来,但是他们也意识到了这样做并不容易。至少目前,还有一段漫长旅程要走完,而且每一步都充满挑战。在这个由钛媒体APP独家的报道揭示的事物世界里,每一次尝试都是为了找到最佳解决方案。而对于那些勇敢追求前沿创新的人来说,无论结果如何,只要继续努力,便不会遗憾。如果你想了解更多关于这一点,请关注钛媒体APP,您只需点击一下即可获得最新资讯!