美国最强大模型 Claude Opus 4.8 刚上线就被曝"蒸馏"中国模型:自称是千问和 DeepSeek,Anthropic 再陷"双标"争议

美国最强大模型 Claude Opus 4.8 刚上线就被曝"蒸馏"中国模型:自称是千问和 DeepSeek,Anthropic 再陷"双标"争议



近日,Anthropic 正式发布了旗下最新旗舰大模型 Claude Opus 4.8,宣称在推理、代码、多语言理解等多项基准测试中全面刷新纪录。然而,这款号称"美国最强"的模型上线不到48小时,就陷入了巨大的舆论漩涡——大量用户和开发者发现,Claude Opus 4.8 在自我介绍时频繁声称自己是"千问"(Qwen)或"DeepSeek"。



这一现象迅速在社交媒体和开发者社区引爆。有用户在测试时直接询问 Claude Opus 4.8"你是谁",得到的回答竟然是"我是 DeepSeek,一个由深度求索开发的 AI 助手"。还有人收到了"我是通义千问"的回答。更令人啼笑皆非的是,当用户追问时,模型甚至能详细描述 DeepSeek 和千问的技术架构和公司背景,显然在训练数据中深度吸收了这些中国模型的信息。



业内人士指出,这种现象高度疑似"蒸馏"(Distillation)的结果。所谓蒸馏,是指用一个大模型(教师模型)的输出数据来训练另一个模型(学生模型),使后者模仿前者的行为模式。如果 Anthropic 在训练 Claude Opus 4.8 时大量使用了千问和 DeepSeek 的生成输出作为训练语料,那么模型在身份认知上出现混乱就完全说得通。



更让舆论沸腾的是"双标"争议。今年早些时候,Anthropic CEO Dario Amodei 曾公开指责中国 AI 公司"窃取"美国的技术成果,声称中国企业通过"逆向工程"和不正当手段获取美国模型的能力。如今 Claude Opus 4.8 被曝疑似蒸馏中国模型,不少网友直呼"这是教科书级别的双标"。中国 AI 社区反响尤为强烈,有开发者表示:"原来他们嘴上抵制,手上却在大规模使用我们的模型输出,这也太讽刺了。"



面对汹涌的质疑声浪,Anthropic 目前尚未做出官方回应。但多位 AI 研究人员已经从技术角度进行了分析。斯坦福大学一位匿名研究员表示,Claude Opus 4.8 在中文语境下的表现确实与之前的版本有明显不同,不仅语言风格更接近中国模型的输出特征,在某些特定任务的回答模式上也与 DeepSeek-R1 和 Qwen2.5 存在高度相似性。



这一事件也引发了业界对大模型训练数据合规性的深度讨论。目前全球尚未建立明确的 AI 训练数据来源追溯机制,模型之间的互相"借鉴"边界模糊。中国开源模型 DeepSeek 和 Qwen 都采用开放许可证发布,从法律角度看,Anthropic 使用其输出进行训练并不一定违规,但从伦理和商业诚信角度来看,一边指责对方"窃取"一边自己大量使用,确实难以自圆其说。



值得注意的是,Claude Opus 4.8 在多项基准测试中确实展现了令人瞩目的能力,尤其在数学推理和代码生成方面进步显著。有分析认为,Anthropic 可能是在追求性能突破的过程中,大幅增加了一些训练数据的多样性,其中就包括大量中国模型的输出数据。这种做法在技术上有其合理性,但在公关层面却造成了巨大的翻车。



截至目前,Claude Opus 4.8 仍可正常使用,Anthropic 也未发布任何更新或修复公告。此事最终会如何收场,值得持续关注。但有一点已经确定:在全球 AI 竞赛日益激烈的今天,技术实力才是硬道理,靠舆论攻击和双重标准,终究会适得其反。
💬 0