网络安全新挑战：如何验证 AI Agent 的真实性 - 网络安全

　　过去二十年里，网络安全的核心始终是保护人类免受机器威胁——拦截恶意软件、过滤钓鱼邮件、企业缓解DDoS攻击、抢在攻击者之前修补软件漏洞。对手明确，攻击面清晰，防御手册虽不完美但至少脉络分明。然而这个故事正在改写。

　　网络安全的下一个重大前沿并非防御AI，而是建立对AI的信任机制。

　　Agent已悄然渗透企业防线

　　当前部署的自主AI Agent正在执行读取收件箱、运行代码、转移资金、审批合同等决策行为——这些在过去都需要人类签字确认。Agent经济并非遥不可及，它已渗透至您的安全边界内部。

　　其应用速度之快不难理解，生产力提升效果确实显著：单个AI Agent能将分析师数周工作压缩至数小时。但大多数机构尚未意识到关键问题：当AI Agent代表您采取行动时，如何确认其真实身份?

　　潜伏在明处的信任危机

　　传统网络安全以身份认证为基石，零信任架构的诞生正是因为我们深知"网络内部存在"不等于"合法身份"。我们认证用户、验证设备、实施最小权限管控、记录审计一切行为——但这些基础设施设计时都未考虑AI Agent。

　　如今当自主AI Agent向API、数据库、金融系统或其他Agent发起请求时，接收方通常缺乏可靠机制来：验证其身份、确认其权限范围、检查指令是否遭篡改、或实时撤销其访问权限。这些Agent如同陌生人，却总能长驱直入。

　　这并非理论漏洞，而是随着Agent规模化部署每月都在扩大的系统性缺陷——而历史证明，恶意攻击者最擅长利用此类缺陷。

　　验证难题的深层挑战

　　验证AI Agent的复杂性远超单纯增加认证层，其本质迥异于人类或传统软件验证，原因有四：

　　动态行为特性：与行为固定的静态应用不同，AI Agent的能力和行动会随上下文、指令及底层模型动态变化。部署时的"安全"验证无法预判其后续行为。

　　链式运作模式：现代AI工作流涉及多Agent管道，任务在Agent间层层委托。每个交接点都可能成为欺骗、注入或权限扩散的突破口。仅验证链条首端Agent远远不够。

　　跨组织交互：代表您公司的AI Agent可能正与供应商、客户或云服务商的Agent通信。目前尚无跨组织的Agent互信框架。

　　指令层攻击面：通过外部数据嵌入恶意内容劫持Agent行为的提示词注入攻击已现真实案例。验证不仅要确认Agent身份，更要确保其执行指令未经篡改。

　　行业开始行动应对

　　新兴框架和项目的出现，标志着安全社区已意识到问题严重性。

　　Anthropic的网络安全验证计划(CVP)指明了行业方向。该框架用于验证与Claude基础设施交互的合法网络安全运营商，包括双重用途工具和攻防研究，其核心认知在于：AI时代的安全需要主动验证而非被动假设。

　　Lyrie.ai作为首批入选CVP的企业，专注为AI Agent和自主系统开发安全工具。其入选也折射出行业共识：保护AI系统需要专为其运作模式打造的安全平台，而非改造那些本非为其设计的旧安全模型。

　　但CVP只是起点。行业需要的不仅是针对个别运营商的验证计划，更是能使Agent验证成为生态基础能力的开放互操作标准。

　　标准框架的雏形

　　AI Agent加密验证标准至少需解决五个问题：Agent身份、授权范围、是否遭篡改、委托链条及实时撤销能力。这些概念在代码签名、证书颁发和身份联盟中已有对应，挑战在于适配AI Agent的动态性、委托模式和指令可操纵性。

　　Lyrie研究团队发布的Agent信任协议(ATP)正是这样的开放加密标准，已提交IETF审议。比具体标准更重要的是：必须在规模化部署使改造变得不可行前，尽快启动标准制定讨论。

　　互联网发展史堪称前车之鉴：电子邮件诞生时缺乏认证机制，导致数十年后我们仍在与垃圾邮件、钓鱼和欺骗作斗争。AI Agent领域不能再重蹈覆辙。

　　安全团队当务之急

　　已部署或计划部署自主AI Agent的企业，应立即向自身和供应商追问以下问题：

　　Agent身份如何建立和维护?

　　控制Agent行为的访问权限如何在运行时(而不仅是配置时)强制执行?

　　多Agent委托链如何审计?

　　Agent异常行为处置及权限撤销速度?

　　Agent运行的AI基础设施是否经过独立安全验证?

　　若答案模糊，未必说明供应商不成熟，更可能意味着正确问题刚刚进入主流视野。率先解决这些问题的企业，不仅将获得安全优势，更能赢得客户、合作伙伴和监管机构对其AI系统的信任。

　　验证层将成为新战场

　　网络安全始终在与新威胁共同进化：云时代催生新一代身份与访问管理，移动时代孕育终端管理与零信任网络，而IoT时代至今混乱的根源正是标准与验证的滞后。

　　AI Agent的普及速度史无前例。企业为真实存在的效率提升争相部署，攻击者则已开始寻找系统弱点。AI Agent的验证与身份核查必将成为企业安全标配，关键在于行业能否在重大事件倒逼前建立正确标准与保障。

　　当前绝大多数在线交互的AI Agent缺乏可信身份框架，导致企业难以确认通信对象真实性。填补这一缺口，正快速成为网络安全行业亟待解决的下一个重大课题。

网络安全新挑战：如何验证 AI Agent 的真实性
2026-05-19 FreeBuf