这次是阿里！中国的大模型团队快被 Anthropic 告完了

本文作者：高允毅

2026-06-25 23:02

导语：这是Anthropic迄今控诉的最大规模“模型蒸馏”案。

这是Anthropic迄今控诉的最大规模“模型蒸馏”案。

作者丨高允毅

编辑丨马晓宁

Anthropic已经告了四家中国AI公司

短短四个月，四家中国顶级AI公司被Anthropic接连点名，且没有停手的迹象。

这一次，轮到阿里。

2026年6月10日，Anthropic向美国参议院银行委员会递交了一封信，矛头直指阿里Qwen团队。报告披露了一串数字：从4月22日到6月5日，整整45天，阿里相关运营者利用2.5万个账号，完成了2880万次交互。

这是Anthropic迄今公开的最大规模“模型蒸馏”数据。

2880万次对话是什么概念？放一个行业参照：目前主流的高质量SFT（监督微调）数据集，规模通常在数十万到几百万条之间。2880万次针对核心能力的定向交互，足以在特定任务域内，低成本“提纯”出一个极具竞争力的专用模型。

这引起了Anthropic的高度警惕。在他们看来，对方的行为目标极其精准，刀刀直指其最新旗舰模型 Mythos Preview 的核心底牌，软件工程与智能体推理能力。

Anthropic在信中将其定性为“迄今为止，中国公司试图搭美国顶尖实验室便车的最大规模尝试”。

梳理时间线可以发现，Anthropic的反击正在显著升级。

2026年2月23日，Anthropic发布了一篇博客文章《Detecting and Preventing Distillation Attacks》，公开点名三家中国AI实验室：DeepSeek、月之暗面（Kimi）、MiniMax（稀宇科技）。

报告显示，约2.4万个中国相关账号对Claude发起了超过1600万次交互，其中MiniMax超1300万，月之暗面超340万，DeepSeek超15万。

从1600万次到2880万次，规模在翻倍，Anthropic的反击，也从2月份的“技术曝光”，升级到6月份“政治施压”。

而这次的收信人，银行委员会主席蒂姆·斯科特（Tim Scott）和首席成员伊丽莎白·沃伦（Elizabeth Warren），可以说是美国政坛里专门负责“对外经济制裁”和“对内金融监管”的两个狠角色。

Anthropic告状目的是什么

Anthropic的应对策略，从一开始就不是打官司，而是推动立法。

据彭博社报道，信件递交后，美国参议员比尔·哈格蒂和安迪·金迅速跟进。他们计划推动一项修正案并纳入《国防法案》：对任何“不当获取美国AI模型输出以训练竞争系统”的中国公司，实施严厉制裁或直接列入黑名单。

事实上，不仅是在白宫，整个硅谷也在结成防御同盟。Anthropic、OpenAI 和谷歌已经暗中联手，开始共享关于违规数据抓取的情报。

在海外媒体报道中，美国官员曾做出过一个估计，这种未经授权的“工业级”蒸馏活动，每年给硅谷实验室造成的损失高达数十亿美元，直接威胁着Anthropic即将到来的天价IPO。

所以，借由这一次次越发严厉的指控，Anthropic真正想拿到的，不只是一家公司的商业维权，而是要在美国政界与产业界确立一条新的绝对红线：用API输出训练竞争模型，就是越界违法。

而在这场全方位的围堵中，美国政府的技术封锁也在急剧收紧，与前段时间业内轰轰烈烈的“Fable 5 与 Mythos 5 紧急下架”事件暗中呼应。

与国会山上的剑拔弩张不同，在开发者聚集的Reddit等技术论坛上，面对Anthropic的控诉，技术圈的反应堪称群嘲。

最经典的就是“贼喊抓贼”的戏码。有人指出，Anthropic 自己就是靠“偷数据”起家的。早期训练模型时，它因抄袭并非法下载数百万册受保护的书籍，曾陷入美国历史上规模最大的 AI 侵权盗版案，最终被迫吞下 15 亿美元的天价和解金。

连马斯克都曾在今年2月份公开贴脸开骂，在Anthropic指控中国的 DeepSeek、月之暗面（Kimi）以及 MiniMax发起蒸馏攻击，直指 Anthropic 才是北美最大的“偷子”，伪善又虚伪。

还有网友直接翻出了业内的著名回旋镖，此前 Anthropic 发布的 Claude 4.8 模型在回答，透露自己其实是“由阿里巴巴开发的Qwen模型”。“业内互相洗数据、抄来抄去早已是常态，你身上流着通义千问的血，回过头来告阿里抄袭？”

还有网友表示，如果是正常的付费使用，那和其他普通用户的区别在哪，这只能算商业违约，怎么到了国会嘴里就变成‘恶意网络攻击’和‘危害国家安全’了？”

更有技术流网友对 Anthropic 的高管能力表示鄙视：“遇到技术漏洞不想着怎么提升自家的 AI 防御层和反抓取能力，天天只知道跑去和特朗普政府打小报告。”

最让人啼笑皆非的却是一位重度用户的哀嚎：“我真正关心的只有 Fable 5 还能不能回来？Anthropic 现在一边和白宫打小报告哭诉模型被抄，一边又希望模型解禁。照这个趋势看， Fable 5 大概是回不来了。”

漩涡中心：对抗性蒸馏技术

再看技术层面，整场指控的核心落在一个词上：“对抗性蒸馏”。

什么是对抗性蒸馏？简单来说，就是借别人的脑子，替自己省钱。

原本，“蒸馏”是AI训练中的正常操作：用一个已有的强大模型当“老师”，让它回答问题，然后把“老师”的答案拿过来，训练一个更轻量的“学生”模型。学生模型只学到了老师回答问题的能力，但训练成本只有老师的一小部分。

Meta 的 LLaMA 早期版本用 ChatGPT 的输出来训练自己，这在行业里不是秘密。

而 Anthropic 控诉的“对抗性蒸馏”，则是将这套思路发挥到了极致。不需要自己花几十亿美元买算力、自己做数据标注，只需要持续、大量地向目标模型发送精心设计的问题，把它的高质量回答批量保存下来，就拥有了一个现成的训练样本库。

这可省了一大笔钱。按Claude的公开API定价粗算，2880万次交互的费用，哪怕按企业折扣计，也要几百万美元。但与从零开始训练一个具备同等软件工程能力的大模型相比，这笔数字可能只是预算单上的零头。

这就是Anthropic愤怒的主要原因，对方跳过了多年的技术积累和巨额投入，用几百万美元的调用成本，拿到了价值数十亿美元的能力。

而Anthropic在报告中特意强调另一个问题，直指“安全”。

AI模型的核心能力分为两种，训练方式截然不同：

一种是“干活能力”，比如写代码、做数学题、写文案......只要给足标准答案，模型就能快速学会，这部分能力是可以被“蒸馏”的。

另一种是“安全对齐”，比如知道不该泄露用户隐私、不该协助犯罪、不该输出危险内容。这些安全规则不是靠反复刷题学来的，而是通过一套极其精细的“行为矫正”训练建立起来的。每一次模型试图越界，就会被训练师惩罚并矫正。

但蒸馏的过程，只复制成功，不复制拒绝。

在导出的2880万次对话里，那些被系统拦截、拒绝回答的高危问题，全被过滤掉了。结果就是，学生模型只学会了顶级的能力，却没学到“什么不该说”。一旦部署到真实世界中，能力越强，失控的结果也会越严重。

API安全：防御永远比进攻慢

而在“对抗性蒸馏”的暗面，则涉及到“API安全”。

这次Anthropic能检测出这25000个异常账号，其实依赖的是“行为模式分析”，即找“破绽”。比如这些账号的注册时间过于集中、IP地址在地理位置上异常扎堆、提问的内容高度相似，且请求频率快得根本不像人类。

但这只是初级防御。当下，部分顶级AI实验室，已经在落地一种更具杀伤力的武器，叫"输出指纹"技术。它如同“隐形水印”，它会在模型的每一次输出中嵌入统计学层面的隐性标记，只要有人拿这些内容去训练新模型，日后一经检测，就能被精准溯源追踪。

然而在真实的工程世界里，防御天然滞后于进攻。

所谓“道高一尺，魔高一丈”。今天你封禁了25000个账号，明天对方就可以用无数个不同的虚拟信用卡和动态代理IP，分散注册；你通过分析查询模式来抓机器账号，对方就可以在代码里刻意加入像真人一样的停顿和废话来做伪装；你种下隐形的“输出指纹”，对方就能通过二次改写、翻译和增噪，把这些指纹彻底“洗”掉。

这场猫鼠游戏没有技术终局，只有成本的此消彼长。

但如果制裁清单落地，游戏规则就变了。到那时，这就不再是一个单纯的“反爬虫”或“API攻防”的技术问题，“谁的模型训练数据来自哪里”，将直接成为极其严苛的监管审查对象。

对所有在LLM工程链条上工作的人来说，这个结果将直接决定未来的合规边界：哪些数据来源是合法的？哪些模型的行为会被秋后算账？又有哪些公司，会因为训练数据“来路不明”而直接被列入致命的黑名单？

这才是 Anthropic 真正的野心所在——在废墟上建立一套由它定义、并由政治力量执行的全球 AI 新秩序。

参考链接：

https://www.bloomberg.com/news/articles/2026-06-24/anthropic-accuses-alibaba-of-illicitly-accessing-its-ai-models

https://www.reddit.com/r/ClaudeAI/comments/1uexovy/anthropic_allegations_of_unauthorised_access_by/

上车，雷峰网(公众号：雷峰网)带你看遍全球 AI 顶会精华

可独家畅览：

专家演讲PPT

大会报告全文

热门论文解读

学术新星访谈

扫描上方二维码

或点击「阅读原文」关注专区。

雷峰网原创文章，未经授权禁止转载。详情见转载须知。

0人收藏

高允毅

编辑

发私信

当月热门文章