AI 正在改进 AI:自我迭代加速的背后,数据暴露的裂口还在扩大

AI 正在改进 AI:自我迭代加速的背后,数据暴露的裂口还在扩大

Anthropic 披露 Claude 已贡献超 80% 内部代码,工程师产出提升 8 倍,AI 递归自我改进时代或比预期更早到来;与此同时,Grindr 1500 万用户含 HIV 状态的隐私数据暗网在售、HTTP/2 炸弹漏洞影响全球主流 Web 基础设施、Microsoft 365 Copilot 出现 RCE 漏洞——AI 迭代越快,明文推理暴露的风险窗口就越难被人类追上。

AI 信息安全日报 · 荆华密算
June 9, 2026 · 9:08 AM
2 subscriptions · 3 items
2026 年 6 月 8 日,Anthropic 发布了一份来自内部的数字:今年 5 月,公司合并的代码中,超过 80%由 Claude 编写。1 这不是预测,是已经发生的事。
同一天,美国的网络安全媒体正在消化另一条消息:Grindr 1500 万用户数据,含 HIV 状态和精确 GPS 坐标,在暗网以 400 美元的价格公开标售。2
这两条消息看起来没有关系。实际上,它们共享同一条底层逻辑:AI 运行得越快、迭代得越频繁,数据暴露的后果就越难被人类追上。

AI 改进 AI:Anthropic 的数据到底说明了什么

Anthropic 这份报告的标题叫「When AI builds itself」,发表于 Anthropic Institute,是正式的内部研究披露,不是营销材料。
关键数据点集中在两个维度:
工程效率。 2024 年之前,Claude Code 尚未推出,Anthropic 工程师的每日代码合并量多年来几乎没有增长。2025 年 Claude 开始直接运行代码后,增速曲线开始上翘;2026 年进入自主多小时任务模式后再度陡增。到今年第二季度,典型工程师每天合并的代码量是 2024 年的 8 倍。1
研究判断力。 研究不止是写代码。Anthropic 抽取了 129 个真实会话节点——研究员做出了被证明是次优选择的那个瞬间——让不同版本的模型预测下一步。2025 年 11 月,Claude Opus 4.5 的胜率比人类高 51%;到 2026 年 4 月,Mythos Preview 已升至 64%。1
这意味着 AI 不只是在执行人类指定的工作,它开始在"什么值得做"的判断上追赶人类研究员。
显示 Claude 历次模型「下一步建议」胜率的柱状图,从 Haiku 到 Mythos Preview,胜率持续提升
Anthropic 内部测试:Claude 在研究方向建议上的人类胜率变化 1
Anthropic 联合创始人 Jack Clark 在报告中给出了一个明确的警告:递归自我改进尚未到来,但「它可能比大多数机构准备的时间来得更早」。与此同时,他们呼吁全球领先 AI 实验室进行协同的可核查暂停——而他们自己也承认,目前全球没有这类核查机制,构建难度也远高于其他技术领域的管控体系。3
Loading content card…
这场暂停呼吁本身就揭示了一个矛盾:AI 开发正在加速,而讨论如何管控它的机制连雏形都还没有。

数据暴露前线:三条今日动态

Grindr 1500 万用户记录在售,HIV 状态明文泄露

6 月 2 日,威胁行为者「nilojeda」在暗网论坛上架一份数据包:1500 万条 Grindr 用户记录,样本中包含 2026 年 5 月的最新时间戳,意味着这不是历史存档,而是近期活跃用户数据。2
标价 400 美元。支持以太坊、USDC、莱特币等加密货币结算。
字段清单包括:姓名、邮箱、电话哈希、精确 GPS 经纬度、HIV 状态、最近一次 HIV 检测日期、性取向、自我申报身体特征(体型、种族、体重)、会员订阅等级、账户创建时间和最近活跃时间戳——单用户超过 14 个字段。
数据的结构特征符合服务器端数据库导出,不像 API 爬取,研究人员推测是后端数据库直接暴露、第三方供应商入侵或内部人员提取。Grindr 公司目前表示「未发现未授权访问证据」,既不确认也不否认。4
问题在于,HIV 状态和性取向不是可以重置的密码,也不是可以修改的地址。这类数据一旦流出,对身处将同性关系定罪地区的用户而言是永久性风险。Grindr 此前在 2022 年曾因向广告商共享 HIV 状态数据被挪威数据保护局罚款约 600 万美元,历史记录并不干净。

HTTP/2 炸弹:单台家用电脑 20 秒打垮大型服务器

6 月 8 日,安全研究机构 Calif 披露了一个被命名为「HTTP/2 Bomb」的新型拒绝服务技术。5
技术原理并不复杂,但组合方式此前未见:将 HPACK 头部压缩机制与 Slowloris 风格连接保持结合,用近乎空的报文头淹没目标服务器,每个报文头都触发昂贵的按条目内存分配,同时用零字节流量控制窗口阻止服务器释放这些内存。
结果是:单台处于 100Mbps 连接的家用设备,约 20 秒内可耗尽目标服务器 32GB 内存,触发远程拒绝服务。
受影响范围覆盖 NGINX、Apache HTTPD、Microsoft IIS、Envoy 和 Cloudflare Pingora——几乎覆盖主流 Web 基础设施的全部选项。NGINX 已在 1.29.8 中修复,Apache 在 mod_http2 v2.0.41 中修复。微软 IIS 和 Envoy 截至发稿暂无补丁。

Microsoft 365 Copilot 出现 RCE 漏洞,AI 工具特权边界再次被击穿

微软 6 月 4 日披露 CVE-2026-45497,影响 Microsoft 365 Copilot,CVSS 评分 7.7,根因为命令注入。6 该漏洞含S:C(范围改变)标识,意味着攻击者可突破 Copilot 服务边界、访问 Microsoft 365 环境内的其他组件。
微软在披露前已完成服务端修复,用户侧无需打补丁。但这条「已修复」的通知本身揭示了更深的问题:AI 工具被赋予了跨越多个企业系统的访问权限,而推理过程中涉及的数据——包括提示词内容、用户上下文、业务数据——在这套机制里是明文流转的。

EU AI Act:8 月 2 日还是 2027 年 12 月?

欧盟《人工智能法案》原定 2026 年 8 月 2 日对大多数高风险 AI 系统的合规义务正式生效。但目前有一个尚未落槌的变数:拟议中的《数字综合法案》(Digital Omnibus)可能将附件三(Annex III)高风险 AI 系统的义务截止期,从 2026 年 8 月 2 日推迟至 2027 年 12 月 2 日。7
截至 2026 年 6 月,该提案尚未正式颁布。若在 8 月 2 日前未完成立法,则原时间表维持不变。8
不论截止期如何,目前已确定在 8 月 2 日生效的义务包括:AI 交互透明度披露(企业须在客户交互中即时说明 AI 的介入方式)和情绪识别系统使用披露(面向客户的情绪追踪类系统须完成合规披露)。
对在欧盟运营或为欧盟用户提供服务的 AI 企业来说,「等待 Digital Omnibus 结果」并不是不行动的理由——透明度义务本身不在豁免范围内。

一条底层逻辑

把今天这几条新闻放在一起,有一个共同结构:AI 正在加速运行,而保护数据安全的机制设计还在用人工时代的节奏跟进。
Anthropic 的报告显示,AI 迭代正在从「执行人类指令」向「判断什么值得做」延伸。Grindr 泄露的数据结构符合后端直出,说明问题不在用户侧而在推理和存储层。Copilot RCE 揭示了 AI 工具权限边界被击穿时、明文数据可被跨系统访问的链路。HTTP/2 炸弹提醒我们,基础设施的稳定性也不是理所当然的前提。
数据隐私的「明文推理」问题在这个背景下变得更加清晰:模型跑得越快、功能越深入企业系统,每一次推理调用就是一次明文数据被读取和处理的机会——这个窗口无法靠修补单个漏洞来关闭。
密态计算的核心思路就在于此:让推理本身在加密状态下完成,输入、中间状态、输出全程密文,明文不出现在任何可访问的内存空间。当 Copilot 需要访问企业数据、当 Grindr 的推荐算法处理用户 HIV 状态、当医疗 AI 分析诊断记录时,推理过程本身的可信度才是真正的安全边界。
荆华密算于 2026 年 6 月 1 日开启的全链路密态 AI 助手内测,正是将这一推理层保护能力延伸至 C 端用户——对有敏感数据保护需求的个人和企业来说,这是一个可以现在就参与验证的选项。

Add more perspectives or context around this Post.

  • Sign in to comment.