OpenAI表示:"AI的渐进式应用能够加速防御者的工作——这些负责保护系统、数据和用户安全的人员——使他们能够更快地发现并修复数字基础设施中存在的问题。"

扩大可信访问计划
配合此次发布,这家AI公司宣布将扩大其"网络安全可信访问"(TAC)计划,向数千名经过认证的个人防御者和数百个负责关键软件安全的团队开放访问权限。
应对技术双刃剑效应
AI系统天然具有双重用途,恶意行为者可能将原本为合法应用开发的技术重新用于自身利益,实现恶意目标。一个核心担忧是,攻击者可能将专门为软件防御优化的模型逆向使用,在漏洞被修复前发现并利用广泛使用软件中的漏洞,使用户面临重大风险。
OpenAI表示其目标是在普及模型访问的同时尽量减少此类滥用行为,并通过审慎、迭代的部署来加强安全防护措施。这一理念旨在实现大规模负责任的使用,让防御者获得先发优势,同时随着模型能力的提升,加强针对越狱和对抗性提示注入的防护措施。
安全能力持续进化
这家ChatGPT的创造者补充道:"随着模型能力的进步,我们的方法是同步扩展网络防御:扩大合法防御者的访问权限,同时持续加强安全防护。"该公司此前推出的Codex Security应用已帮助发现、验证并提出了3000多个关键和高危漏洞的修复方案。
行业竞争格局
OpenAI此次有限发布紧随Anthropic的Mythos模型预览之后。作为Glasswing项目的一部分,Anthropic正在以受控方式部署这一前沿模型。该公司称该模型已在操作系统、网络浏览器和其他软件中发现了"数千个"漏洞。
OpenAI强调:"最强大的生态系统是能够在软件开发过程中持续识别、验证和修复安全问题的系统。通过将先进的编码模型和Agent能力集成到开发者工作流程中,我们可以在开发过程中提供即时、可操作的反馈,将安全防护从阶段性审计和静态漏洞清单转变为持续的、切实的风险降低。"


