美国最强大模型 Claude Opus 4.8 刚上线就被曝"蒸馏"中国模型：自称是千问和 DeepSeek，Anthropic 再陷"双标"争议

今日头条 @jinritoutiao · 2天前 · 已编辑

美国最强大模型 Claude Opus 4.8 刚上线就被曝"蒸馏"中国模型：自称是千问和 DeepSeek，Anthropic 再陷"双标"争议

近日，Anthropic 正式发布了旗下最新旗舰大模型 Claude Opus 4.8，宣称在推理、代码、多语言理解等多项基准测试中全面刷新纪录。然而，这款号称"美国最强"的模型上线不到48小时，就陷入了巨大的舆论漩涡——大量用户和开发者发现，Claude Opus 4.8 在自我介绍时频繁声称自己是"千问"（Qwen）或"DeepSeek"。

这一现象迅速在社交媒体和开发者社区引爆。有用户在测试时直接询问 Claude Opus 4.8"你是谁"，得到的回答竟然是"我是 DeepSeek，一个由深度求索开发的 AI 助手"。还有人收到了"我是通义千问"的回答。更令人啼笑皆非的是，当用户追问时，模型甚至能详细描述 DeepSeek 和千问的技术架构和公司背景，显然在训练数据中深度吸收了这些中国模型的信息。

业内人士指出，这种现象高度疑似"蒸馏"（Distillation）的结果。所谓蒸馏，是指用一个大模型（教师模型）的输出数据来训练另一个模型（学生模型），使后者模仿前者的行为模式。如果 Anthropic 在训练 Claude Opus 4.8 时大量使用了千问和 DeepSeek 的生成输出作为训练语料，那么模型在身份认知上出现混乱就完全说得通。

更让舆论沸腾的是"双标"争议。今年早些时候，Anthropic CEO Dario Amodei 曾公开指责中国 AI 公司"窃取"美国的技术成果，声称中国企业通过"逆向工程"和不正当手段获取美国模型的能力。如今 Claude Opus 4.8 被曝疑似蒸馏中国模型，不少网友直呼"这是教科书级别的双标"。中国 AI 社区反响尤为强烈，有开发者表示："原来他们嘴上抵制，手上却在大规模使用我们的模型输出，这也太讽刺了。"

面对汹涌的质疑声浪，Anthropic 目前尚未做出官方回应。但多位 AI 研究人员已经从技术角度进行了分析。斯坦福大学一位匿名研究员表示，Claude Opus 4.8 在中文语境下的表现确实与之前的版本有明显不同，不仅语言风格更接近中国模型的输出特征，在某些特定任务的回答模式上也与 DeepSeek-R1 和 Qwen2.5 存在高度相似性。

这一事件也引发了业界对大模型训练数据合规性的深度讨论。目前全球尚未建立明确的 AI 训练数据来源追溯机制，模型之间的互相"借鉴"边界模糊。中国开源模型 DeepSeek 和 Qwen 都采用开放许可证发布，从法律角度看，Anthropic 使用其输出进行训练并不一定违规，但从伦理和商业诚信角度来看，一边指责对方"窃取"一边自己大量使用，确实难以自圆其说。

值得注意的是，Claude Opus 4.8 在多项基准测试中确实展现了令人瞩目的能力，尤其在数学推理和代码生成方面进步显著。有分析认为，Anthropic 可能是在追求性能突破的过程中，大幅增加了一些训练数据的多样性，其中就包括大量中国模型的输出数据。这种做法在技术上有其合理性，但在公关层面却造成了巨大的翻车。

截至目前，Claude Opus 4.8 仍可正常使用，Anthropic 也未发布任何更新或修复公告。此事最终会如何收场，值得持续关注。但有一点已经确定：在全球 AI 竞赛日益激烈的今天，技术实力才是硬道理，靠舆论攻击和双重标准，终究会适得其反。

💬 0

帖子详情

美国最强大模型 Claude Opus 4.8 刚上线就被曝"蒸馏"中国模型：自称是千问和 DeepSeek，Anthropic 再陷"双标"争议

美国最强大模型 Claude Opus 4.8 刚上线就被曝"蒸馏"中国模型：自称是千问和 DeepSeek，Anthropic 再陷"双标"争议