Anthropic最新推出的Claude Opus 4.6目前位居AI模型排名首位,不过这一领先地位或许只是暂时的——至少要等到Artificial Analysis完成对OpenAI Codex 5.3的基准测试,毕竟后者在编码领域很可能更具优势。在由编码、代理任务、科学推理等十项测试构成的人工智能分析指数中,Claude Opus 4.6表现突出,尤其在基于代理的工作任务、终端编码以及物理研究问题这几个方向上均取得了第一名的成绩。
运行完整测试套件的成本是2486美元,这一金额超过了GPT-5.2在最大推理性能下所需的2304美元。Opus 4.6消耗的输出代币约为5800万个,是Opus 4.5的两倍,不过远低于GPT-5.2的1.3亿个。价格更高的原因在于Anthropic的代币定价,其输入和输出代币的定价分别为每百万个5美元和25美元。
Opus 4.6 能够通过 Claude.ai 应用,以及 Anthropic 的 API、Google Vertex、AWS Bedrock 和 Microsoft Azure 这些渠道进行访问。