← 返回资讯列表Claude · Anthropic

Claude Mythos 内部测试成绩曝光:SWE-bench 93.9%

Anthropic 确认 Claude Mythos Preview 存在但仅限 Project Glasswing 约 50 家合作方使用。该模型 SWE-bench 达 93.9%,但因其能力过强(发现大量零日漏洞)而被限制发布。

查看原文 →