
在2025年,AI不再是一代内容,它成为各行各业的“第二大脑”。借助新一代的大型模型,例如GPT -4.5和DeepSeek,我们进入了代理AI(代理AI)时期 - 仅仅可以对其进行交谈,而是可以思考,练习和合作,并更改完整的生产力范式,并更改AI编码:开发人员从代码的辅助工程和编码委托的代码范围内变化了:安全委托的代码:SEC级的SECIL:SECIL:SECIL A'S SUPPERE'S SUPPERE'S SUPPERE'S SUPPERE'S SUPPERE'S SUPPERE'S SUPPERE'S SUPPERE'S SUPPERE'S SUPPERE'S SUPPERE'S''''''''迅速的单词工具,但是实际战斗中的“战斗顾问”和“模型是产品”成为现实,AI代理人将会来找您和我。 - 从海外独角兽发布的材料引用。目前,Yunqi Widin尚未停止“可用”。当我们追求“易于使用”时,我们要注意实践中可以实现的实际AI安全功能。从模型培训,数据构建,能力审查到确保Copilot应用程序,我们都可以Ted Secgpt 2.0更聪明,更安全,更安全。可以下载和使用开放型号。 GitHub开源地址:Cloudittera/secgpt模型下载地址:Cloudittera/secgpt数据集下载地址:Datatets/Cloudittera/Security-Daper-Daper-Dataset旁边停止,我们将输入代理安全的未来。欢迎加入这项由“安全救赎”领导的现代技术! 01什么是secgpt?现在,当通用模型骑行世界时,Yunqi Widin选择了一个不同的途径:创建一个真正了解网络安全的大型模型。否。这是对“技术繁荣”的后续行动,但对实际战斗的系统变化。 SECGPT是我们2023年推出的开放式资源,这是首个以世界为重点世界的主要模型。 |我们希望不仅是一个可以“安全”的代理商,而且希望真正“安全”的人。自发布以来,SECGPT继续引起全球安全技术界的高度关注:Github已获得了超过2,3的恒星00+下载拥抱面的下载超过10,000以上的12个安全团队使用安全Q&A等实用活动? SECGPT结合了基本功能,例如自然语言理解,代码生成和安全知识。 It has been able to perform different basic gawsSecurity Art: Analysis of weakness: Identify the causes of weakness, check the scope of impact, and make suggestions for organizing/traffic discovery: Study network behavior, determine if there is a potential attack of threats and assessment of defense: Supporting team drills/blue team analysis: Team/blue team script, the judgment, judgment of the strategy of the approach: Determine team script, recognition of the team's twist, the study of the study: The analysis of the脚本研究:对团队扭曲的分析,脚本的研究:团队,练习/蓝色扭曲的评论分析,对团队划分的演习,意图,揭示了Q&A知识的MGA潜在风险:ASTA对“问答团队的“问答”团队基础的安全知识基础将不再保留在“可以回答”中,而可以通过“呼叫”,“集成”和“协调”来实现,以支持智能工作的复杂安全流。 SECGPT定位:安全代理的主要安全。 Brain ", the SECGPT is the one -language understanding of the language and reasoning of the whole system. Understand the Natural Language: It is important to lower the threshold for use, helping non -security experts to combine security knowledge: have contextual relationships and multi -step justification capabilities to continue to know the comment: single-point intelligent assistant or a embedded engine work, the secgpt has a strongadaptation, scalability and security control. 02 Why do we keep更新SECGPT,因为SECGPT是2023年的开放资源,大型语言模型继续发展。OL呼叫和多任务合作,行业标准已多次替换并进入代理商的时间。同时,Yunqi Widin还继续促进Secgpt Pro Security模型的商业版本的许多迭代,其基本功能已取得了代际跳跃。但是,资源的开放版本仍处于早期阶段,并且技术边界逐渐以语言表达方式显示,了解接口的安全性和兼容性,从而难以应对当前的安全活动的复杂性和pchange。因此,我们决定全面升级SECGPT的开源模型,继续恢复到全球安全社区,并在更多情况下促进安全代理人的实施和演变。 1)模型基础架构正在发生变化,并且旧模型功能的边界逐渐公开。大型领域的基础设施语言模型进行了潜在的变化。与以前的模型相比,新一代模型具有更长的上下文处理能力,更好的注意力机制,更清晰的结构化工具呼叫接口以及支持代理流动的控制功能。例如,支持MCP协议,链反应,插件体系结构路由,功能调用,工具内存,工具的工具控制,卷控制和修复方面的修复等等。所有这些都成为安全代理设计的“新基础”。当很长一段时间内没有更新开放资源模型时,它将处理以下技术断开问题:它无法适应新一代的推理引擎(例如VLLM,TGI),并且可能与有组织的插件呼叫(API调度/调度/调度)不兼容。缺少链链调度功能(RUTAL路由任务),微调系统不能与最新的安全数据(SFT+RLHF+RAG)保持一致。在受欢迎程度上f明智的主体的形式,能够快速提升的能力,直接影响用户的体验和模型实现价值。 2)升级安全任务结构并通过模型功能的多维要求。早期模型用户通常专注于问答任务,例如人口安全知识,命令分析,脚本理解等。这种类型的工作主要取决于语言理解能力并具有相对简单的结构。 However, when the security model actually enters actual situations such as R&D, offense and defense, and operations, the tasks show a clear trend of structured, multi-round and tooling: weakness of the chain → multi-log input + multi-stage causal reasoning construction of multi-language/relationship + graph + graph Generation Security Operation Collaboration → Scheduling tool + Status Feedback + Report output the type of work that requires a model that is not only semantic understanding as好吧S:仅立即注入或零样本信号的施工能力(经过思考的链/事树)能力远远不够。 3)现实的挑战:一般模型无法替代专业安全模型。尽管诸如DeepSeek,Qwen和Llama之类的开放资源模型在对法规的语言和生成等活动中取得了重大发展,但在安全场景中,他们面临着以下结构性瓶颈,尤其是在私人企业级别上:(1)对Colpus安全支持的主要面皮知识。通用模型训练语料库主要是开放的,并且严重缺乏以下高度的安全语料库值:渗透测试日志,链条行为样本,系统呼叫轨迹,Kahadditional使用(POC/EXP),红色团队审核报告等。这直接限制了他掌握实际战斗进攻和防御的详细信息的能力。(2)语义建模能力很弱,并且在安全背景中缺乏意识。在理解弱点的原因,系统上下文化以及对协议行为的评估等活动中,了解一般模型的能力主要是肤浅的表达,并且不可能执行链条建模和深层语义推理的原因,并且在“进攻性和防御性环境”下缺乏专业理解。 (3)对工具接口的调用是不准确的,并且系统正在失去灵活性。通用模型没有适当地集中并适用于安全工具(例如模糊测试框架,弱点扫描仪,Thosestatic机器检查等),导致频繁的参数调整错误,上下文预防和呼叫逻辑混乱,在呼叫第三方接口时,会严重影响工作和稳定性的实施。 (4)了解链的结构缺失,推理并不相关执行。安全活动通常涉及多步推理(理解→评论→通话工具→收集反馈→维修建议)。通用模型缺乏对这种类型的“任务链”结构建模的能力,并且经常显示中途跳跃,逻辑中断和输出分歧,并且无法获得复杂的工作流程计划活动。当前的一般模型通常是“平稳的语言,但坚持逻辑,平稳的表达,但混乱的结果”。在真实的系统系统中,其输出容易出现诸如回答问题,不转换说明,工具呼叫失败和令人困惑的上下文,这些问题很难支持公司对高凭证的实际需求,高-UP -UP -UP -to -Conto -Conto -Control and High Security and High Security and High Security and -High -Security and -High -agravable Ascravable Accordents。 03 SECGPT在此更新中有哪些测量值改进?实现大型模型功能。为复杂的安全水平提出了许多推理和明智决策的循环。这些更新的旋转的亮点1。更强的基础功能:一般 +安全性深入集成,我们基于QWEN2.5-INSTRUCT系列和DeepSeek-R1系列基本模型,伴随着自我构建的安全任务和安全性知识基础,我们继续在8 A100 GPU CLUSTERS上进行培训者,以多于每周的gpu clusters进行比较良好的范围,以进行更大的改进,以进行更大的改进,以进行更大的努力,以进行更大的努力 +努力,以实现良好的努力,以实现良好的研究,以实现良好的研究,以实现良好的努力,以提高效果,以实现良好的努力,以提高训练,以实现良好的调整,以实现良好的努力,以提高训练,以提高训练,以实现良好的努力。下图显示了在训练过程中每个关键指标演变的演变:训练和验证的丢失(火车/损失和评估/损失):两者都显示了TheA稳定的向下趋势,表明该模型继续与训练集和验证集有关,并且没有过度拟合的迹象。研究/Learning_rate曲线:使用热 +衰减的共同策略,有效地提高了稳定性和SP与早期培训有关的EED。梯度规范:一般断裂 - 改变是稳定的,只有几步,峰值最小,没有梯度爆炸或消失发生,这表明训练过程是健康且稳定的。分析性能:评估/运行时和评估/样本_second变更范围表明,系统资源的使用非常好,并且在评估过程中对吞吐量的理解是稳定的。其他指标:作为培训的数量(火车/周期),输入的MGA标记数(train/num_input_okens_seen),也表明,按计划进行培训过程,并达到预期的计划。训练过程和审查模型图片2的示例。安全语料库的质量较大:私人 +公共数据双轮驱动器,我们构建了一个超大尺度,结构良好的网络安全网络,内容超过40%的内容是手动选择和结构化处理。私人数据系统IncorpOrates具有70多个字段/14种结构标签系统的安全数据资源。在统一清洁,语义注释和重建后,它建立了高质量的代币,为大型模型的深层推理能力提供了稳定的支持。下图显示了语料库组成的词。该系列的一般逻辑符合“理论支持 - 实际对抗 - 应用程序实施”的三个层次结构:理论支持:涵盖强大的材料,例如法律法规,学术角色,行业报告等,这为模型提供了扎实的知识库;实际对抗:包括弱点的细节,CTF银行问题,数量流量,恶意样本和反向分析数据,以改善模型的真实性。实施识别和监视攻击的能力;应用程序实施:涵盖安全社区博客,教育和培训材料,SEcurity知识图和自动化技术,并在安全操作等方案中增强了模型灵活性,并已得到辅助制作。技术亮点:双轮驱动(私人 +公共数据)的机制确保宽度和深度的协调语料库改进;多维标签系统使语料库具有更强的结构化功能和上下文理解能力。三层语料库构造逻辑涵盖了知识构建的完整安全任务链接,威胁对实际扩展的响应。 3。跳跃能力:SECGPT更改为“安全助手”。通过许多数据优化和任务调整的旋转,SECGPT可以获得许多技能的跳跃:更好地了解攻击链,进攻性和防御术语和行业,更好地处理复杂的日志和弱点描述,更适合于私有化的NA扩展,Edge推理和其他LIF。E场景。对改进的基本改进的详细说明1。检查模型能力:全面指标跳跃,实用情报开始完全评估SECGPT的实际安全能力。我们已经建立了一个全面的评估系统,该系统涵盖安全证书问答,一般安全知识,编程能力,对知识和推理功能的理解,主要使用以下标准数据集:CISSP,CS-EVAL,CEVAL,CEVAL,CEVAL,GSM8K,BBH。与原始的SECGPT-MINI模型相比,训练有素的模型在所有指标上都取得了显着的跳跃,如下所示:1)对水平表审查模型的解释:mini→1.5b:具有基本的问答“答案”,适用于中和低任务; 1.5b→7b:推理和能力的深度通常得到显着增强,并且可以理解任务的意图,并且可以建立相对完整的解决方案途径; 7b→14b:能力将转移到“班级专家”级别,并可以处理高层的活动,例如高复杂性 - 级别和高级高级别的刺痛以及高级别的高级别 - comptixity毁灭性构成安全策略。 SECGPT执行的cs-eval在参数的所有参数中都执行而不是qWEN2.5;它声称安全任务和正确修复的任务集合我们开发的一系列任务已大大提高了应用程序和专业Q&A的实用功能。 2。提高安全能力:更全面,更准确,更专业。在升高的升级中,SECGPT完成了结合逻辑输出信息问答知识的能力。具体来说,可以在以下方面看到:更广泛的知识范围:涵盖14种安全知识领域的结构化语料库,例如法律和法规,攻击策略和反向分析;答案的产生更准确:通过对话的许多周期控制和语义优化技术,问答和回答的对准率以及上下文记忆的稳定性得到了改善;推理能力更为突出:它具有Kakayahang连接大量知识和降低复合逻辑,并且可以完成复杂的任务,例如链链攻击和威胁分析。 1)在测试方案中测试测试测试可能会模仿来自信息收集的穿透攻击过程,水平利用了功率较高的弱点,并具有关键命令工具命令,货运构造和链条链生成的功能。 2)日志评估和流量评估。在安全日志和网络流量日志中,SECGPT可以自动确定异常事件,开发链链图并获取主要的IOC(折衷指标),帮助完成事件监控和警报分类。 3)基于理解低数据级别(例如datingssembly,api呼叫序列)的反向审查功能反向审核功能S和行为行为,SECGPT可以帮助进行静态评估,恶意示例的家庭获取和分类特征,并具有一些反向辅助解释能力。 Code 5) Using Tool 04 Next, we have a lot to do ... 1. Exit the Benchmark Evaluation Report report of the First Network Security we will release the first review of the network security model of security and selection reports, focusing on typical situations such as intelligence Q&A threats, code audiences, logs, etc. This report not only provides a clear basis for the community of security technology, but will be a key reference material for partners to produce properly repair techniques and select agent architecture. 2。综合审查:如何培训大型模型,该模型真正“了解安全性”。尽管一般大型模型在语言理解领域取得了重大发展,但可以真正理解链链攻击,弱点和弱点的大型模型有能力推理安全和实践援助仍然很困难。我们将从全栈前景中审查“如何练习有用的安全模型”,包括高质量安全培训,模型架构设计,多任务训练和技能测试,以及促进安全代理→算法→评估,并促进机构的实施→审查安全协议和实施方案,实施了实施实施,实施了实施实施,促进了安全代理的实际实施。算法→分析,并促进安全代理的实际实施。 3。自动化CTF问题损害了分辨率:迈向安全代理的第一步。我们继续在CTF解决问题活动中促进SECGPT自动化功能。目的是实现“了解问题的含义→推理想法→有效载荷构建→完成问题解决问题”的闭环过程。目前,模型是WELL专注于许多真实的问题,并具有初始功能:了解问题的含义并恢复测试点,自动开发攻击链,例如注入,命令和ROP,解释和更改攻击命令的含义,以及类似问题的转移和慷慨。在下一步中,我们将重点关注标准数据构建,解决问题解决问题,自动对解决问题的开发以及共同社区进行实际挑战验证。 CTF方案将是安全模型向代理转移的普遍成功。 4.安全培训数据集慢慢打开,我们建立了一批优质的安全数据集与结构和场景标签混合在一起,涵盖了主要的任务方案,例如知识渊博的问题和答案,代码审核,采矿弱点,智能威胁,交通考试,以及将来,它的WILL支持多色,它将支持多色,交通考试和未来,支持多语言,交通考试,并且将来支持多模式,许多合作练习提高了安全模型的一般和实际适应能力。我们真诚地邀请社区,企业和大学参与数据共同构建,并刚刚为安全模型开发可靠的数据库。 05最后,邀请您参加SECGPT的共同建设。 SECGPT增长不能与安全社区的评论和参与分开。我们邀请:安全研究人员为参与内部测试并创建实用,可靠和安全的行业模型的企业用户提供数据,使用和测试建议。欢迎关注我们,内部测试模型和插件测试渠道的下一个旋转将很快开放!您希望SECGPT为您解决哪些安全问题? w请留言以进行讨论????