Claude Opus 4.5正式发布:性能突破价格减半,AI编码领域迎来新标杆

AI资讯2天前发布 AI工具
8 0

2025年11月25日,北京 — Anthropic公司正式推出新一代AI模型Claude Opus 4.5,在代码生成和智能体应用领域实现重大突破,同时价格大幅下调至原版本的1/3,引发开发者社区热烈反响。

性能全面超越,编码能力显著提升

根据官方发布的基准测试数据,Claude Opus 4.5在多项关键指标上表现卓越。在SWE-bench Verified代码测试中,该模型达到80.9%的准确率,明显优于同门产品Sonnet 4.5(77.2%)和前代版本Opus 4.1(74.5%),同时也超过了竞争对手Gemini 3 Pro(76.2%)和GPT-5.1(77.9%)。

在终端编码测试Terminal-bench 2.0中,Opus 4.5以59.3%的成绩领先,展现出更强的实际操作能力。更令人印象深刻的是,该模型在新型问题解决ARC-AGI-2测试中取得37.6%的准确率,远超其他模型的13.6%-31.1%水平,显示出其在解决未知问题方面的独特优势。

价格策略革新,成本大幅降低

Anthropic此次在定价策略上做出重大调整。Opus 4.5的基础输入令牌价格从Opus 4.1的15美元/百万令牌降至5美元/百万令牌,输出令牌价格也从75美元降至25美元,降幅达到67%。这一价格调整使得更多开发者和企业能够负担得起高性能AI模型的使用。

行业分析师指出,这种大幅降价可能预示着AI模型服务正在从高端市场向大众市场过渡,有望加速AI技术在各个行业的应用普及。

技术突破亮点:持续编码与多任务处理

Claude Opus 4.5最大的技术突破在于其“设置即忘”(set-and-forget)工作模式。与当前主流模型在持续编码时易出现混乱和错误不同,Opus 4.5能够保持极高的连贯性和代码质量,支持长时间后台自动编程任务。

在实际测试中,开发者使用Opus 4.5在6小时内同时推进11个项目,且结果均达到满意水平。该模型还展现出卓越的多任务并行处理能力,通过增强的计划和编码自主性,实现多任务同步进行而不产生冲突。

开发者反馈积极,实际应用效果显著

早期使用者对Opus 4.5给予高度评价。Every公司联合创始人兼CEO Dan Shipper表示:“Claude Opus 4.5代表了编程AI领域的根本性突破,其持续高质量产出代码的能力实现了范式转变。”

多位开发者反馈,新模型在利用多回合交互流程工具方面表现突出,能够实现设计的自主迭代,持续优化直至像素级精准。特别是在配合Playwright等自动化测试工具时,展现出前所未有的深度迭代能力。

市场竞争加剧,AI模型迭代加速

随着Opus 4.5的发布,AI大模型领域的竞争进一步白热化。目前,该模型已通过Claude API在Amazon Bedrock、Google Cloud Vertex AI和Microsoft Foundry三大云平台上线,为用户提供更多选择。

业内人士观察到,各大AI公司正在加速模型迭代节奏,形成“世界上最强大模型”的轮流发布现象。这种竞争态势客观上推动了整个行业的技术进步和价格优化,最终受益的是广大开发者和企业用户。

应用前景广阔,但仍需理性看待

尽管Claude Opus 4.5表现出色,但专家建议用户应根据实际需求选择合适的模型。对于常规编码任务,Sonnet 4.5可能已经足够;而对于需要突破性创新的复杂项目,Opus 4.5的价值将更加明显。

同时,开发者需要注意不同模型的特点和局限性。例如,Claude Code在功能全面性方面领先,但在解决特定难题时可能仍需其他专业模型辅助。


文章来源:本文基于Anthropic官方发布信息、开发者社区反馈及行业分析师评论综合整理。更多技术细节可访问Anthropic官网:anthropic.com/news/claude-opus-4-5

© 版权声明

相关文章

暂无评论

none
暂无评论...