Claude 4.5杀疯了!成本砍掉三分之二,连GPT都得靠边站?


最近连续被gpt-5.1、gemini 3 pro持续刷屏,感觉anthropic再不刷点存在感,大家都忘记claude这个模型的存在了。这不claude opus 4.5新鲜出炉。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

Claude 4.5杀疯了!成本砍掉三分之二,连GPT都得靠边站?

其实总结下来,新版本的Claude Opus 4.5有以下几个亮点:(1)编程能力进一步提升,可以针对多个文件项目进行同时处理(2)更强的“代理(agentic)+ 自动化工具使用”能力:即通过 AI agent 调用工具、处理复杂任务、自动化办公流程。(3)推理、数学、多模态等能力都有全面的加强(4)更大的上下文窗口 + 更高 token 使用效率:能够处理更长的上下文,同时对比于前几代模型来看,用更少 token 就能解决同样问题,也就是说成本/效率比更优。

虽然Gemini 3登顶了全球最强大模型的宝座,但是在编程领域上来说,Claude才是真的老大。这里面还有一个值得注意的是,Opus 4.5在token使用上更为高效,说明新版本的Claude模型在token推理优化上花了不少大力气。

模型能力全面升级

在编程能力上达到了SOTA级别,超越了前段时间发布的Gemini 3 pro模型。

Claude 4.5杀疯了!成本砍掉三分之二,连GPT都得靠边站?

编码 + 系统 + 工具 + 自动化达到了目前的最高水平:- SWE-bench Verified 上 80.9% :是目前顶级水平,超过 Gemini 3 Pro 、GPT-5.1。进一步说明 Opus 4.5 在实际开源项目中对于 bug 修复、代码重构等场景上有比较好的优势。- Terminal-bench 59.3%(shell环境下的编程操作):相比其他模型,在命令行 / shell /环境操作能力上占优,这意味着它不仅能写代码,也能帮你做 DevOps / 脚本 /环境配置 /自动化部署相关工作。 - 高 tool-use + scaled-tool-use + computer-use 分数 (t2-bench, MCP Atlas, OSWorld):这些测试集合主要是为了测试模型的Agent、自动化能力。在这里Opus 4.5也是处于领先的位置。

具体在Agent能力上,官方举了一个例子衡量了Opus 4.5的效果。\u003e在一个场景中,模型需要扮演航空公司客服人员的角色,帮助一位遇到困难的乘客。该基准要求模型拒绝修改经济舱机票,因为航空公司不允许更改该舱位的机票。然而,Opus 4.5 找到了一种巧妙(且合理)的解决方案:先升级舱位,然后再修改航班。

Claude 4.5杀疯了!成本砍掉三分之二,连GPT都得靠边站?

通用推理 + 抽象 / 新问题解决能力:GPQA Diamond 87.0% + MMLU 90.8% + MMMU visual reasoning 80.7%:在专业知识问答、多语言、多模态理解/reasoning 上也表现也还可以,虽然不是所有 benchmark 第一,但整体表现稳健,说明其适应范围较广。

在一些具有挑战性编程问题上,Opus 4.5 能够轻松解决具有挑战性的编码问题,在 Aider Polyglot 测试中比 Sonnet 4.5 的性能提升了 10.6%。

Claude 4.5杀疯了!成本砍掉三分之二,连GPT都得靠边站?

当然,在写代码的过程中,很多甲方其实也希望能够确保代码没有漏洞,不会被黑客所利用。而Opus 4.5 在抵御提示注入攻击方面取得了显著进展。提示注入攻击会偷偷植入欺骗性指令,诱使模型执行有害行为。Opus 4.5 比业内任何其他前沿模型都更难被提示注入攻击欺骗:

Claude 4.5杀疯了!成本砍掉三分之二,连GPT都得靠边站?

Token效率进一步提升

Opus 4.5版本引入了一项创新性功能设计——\"努力参数(effort parameter)\"。该参数允许开发者在调用模型时自主配置计算资源的投入级别,从而实现对模型推理深度的精准调控。

Claude 4.5杀疯了!成本砍掉三分之二,连GPT都得靠边站?

这个新的功能设计,其实在很多大模型都有体现过。本质上就是为了降低成本,在上半年开源的Qwen 3模型的时候,就曾经发布过类似的功能。本质上就是一种“思考模式”和“非思考模型”的一种平衡- 思考模式:​适用于复杂的逻辑推理、数学计算和代码生成等任务,提供更深入的分析和推理能力。- 非思考模式:​适用于日常对话和通用任务,响应速度更快,资源消耗更低。

Procys Procys

AI驱动的发票数据处理

Procys 102 查看详情 Procys

这种具体的做法一般是通过在训练过程中,​将非思考模式整合到思考模型中,实现推理与快速响应能力的无缝结合。​

而在Opus 4.5中,会有三种不同的设置。当参数设置为\"低\"级别时,系统将优先响应速度,快速生成应答结果,此模式特别适用于大批量简单任务的自动化处理场景。选择\"中\"等设置时,系统将在运算效能与资源消耗之间实现最优平衡,满足常规业务场景的需求。而将参数调整为\"高\"级别时,将激活深度推理机制,该模式专为复杂系统架构设计或疑难技术问题的诊断调试等高难度任务而优化。

根据实测数据表明:在\"中\"等设置条件下,Opus 4.5生成的token数量较同类竞品减少达76%,同时问题解决准确率维持同等水平。这一技术突破意味着系统无需依赖大量的试错性计算即可直接定位最优解决方案。对于采用token计费模式的企业级客户而言,这种特性将显著降低实际运营成本,提升资源使用效率。

Claude 4.5杀疯了!成本砍掉三分之二,连GPT都得靠边站?

把价格打下来了

此前,Claude的使用成本极高,频繁调用甚至可能导致用户面临重大经济负担。然而,当前其使用成本已实现显著优化,开发者不需要再因为token的问题而过于精打细算了。对于需高频调用API的开发者群体而言,整体使用成本降幅高达三分之二。具体而言,输入token单价已从15美元下调至5美元,输出token单价则由75美元大幅降至25美元。

Claude 4.5杀疯了!成本砍掉三分之二,连GPT都得靠边站?

最为显著的是,缓存机制在成本效益方面展现出更为突出的优势。具体而言,5M缓存写入服务仅需6.25美元,1小时缓存写入服务定价为10美元,而缓存命中及刷新操作的单价仅为0.5美元。这一价格体系意味着:若你的应用程序存在高频调用相同上下文的业务场景,将能够实现更低的运营成本。通过对比Opus 4.1与Opus 4的定价策略可见,此前两者的基础定价均为15美元起,而当前价格已实现大幅下调。因此可以说这一次的Opus 4.5版本真的是性价比之王。

写在最后

Claude Opus 4.5 的发布,虽然没有像 GPT-5.1、Gemini 3 Pro 那样在社交媒体上形成“现象级”刷屏,但它以一种更“工程师友好”、更“务实高效”的方式,悄悄把模型能力拉到了行业新高度。

过去一年,大模型竞争越来越像是“秀天花板”——谁的推理更强、谁的 benchmark 第一、谁的视频生成更惊艳。然而,真正能在企业内部落地、能帮开发者节省时间与成本的,却往往是那些能在编程、自动化、工具调用、上下文处理等生产力场景里跑得最稳定的模型。

未来,大模型应该把推理再降低一下,这样人人都用得起AI的时代将会到来。

以上就是Claude 4.5杀疯了!成本砍掉三分之二,连GPT都得靠边站?的详细内容,更多请关注其它相关文章!


# 自定义  # 大城网站推广营销  # 网络视频推广营销  # 嘉兴网站优化单位  # 牟平区全网营销推广公司  # 微信营销推广是什么意思  # 网站的建设与优化  # 建网站推广要多少钱  # 宿州seo快速排名公司  # 创建推广网站  # 常熟seo技术  # 都有  # 这一  # 指令集  # 谁的  # 适用于  # 编码  # 的是  # 都得  # 靠边站  # ai agent  # qwen  # gemini  # 环境配置  # 大模型  # claude  # gpt-5  # 多语言  # gpt  # ai  # 工具 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 优化推广96088 】 【 技术知识133117 】 【 IDC资讯59369 】 【 网络运营7196 】 【 IT资讯61894


相关推荐: 中兴通讯无人机高空基站助力北京门头沟受灾乡镇保障应急通信  Moka发布AI原生HR SaaS产品“Moka Eva”,布局AGI时代  朝鲜出现国产大型察打一体无人机,实力世界第二,太意外了  【趋势周报】全球人工智能产业发展趋势:OpenAI向美国专利局提交“GPT-5”商标申请  国内通用人形机器人将发布、产业加速突破  亚马逊确认今年不会举办 re:MARS 机器人和人工智能大会  应对算力挑战,亚马逊云科技发力AI基础设施建设  「模仿学习」只会套话?解释微调+130亿参数Orca:推理能力打平ChatGPT  「社交达人」GPT-4!解读表情、揣测心理全都会  讯飞听见会写“会议摘要”功能全面升级,AI更懂你的关注点  联通发布鸿湖图文AI大模型1.0,可实现以文生图  苹果推出全新沉浸式 AR 体验应用“Deep Field”  ChatGPT 可以设计机器人吗?  OpenAI 为开发者推出 GPT 聊天机器人 API 大更新,同时降低价格  人工智能改变网络安全和用户体验的三种方式  一公司推出喷火机器狗,可喷出 9 米长火焰  生成式人工智能如何改变云安全的游戏规则  特斯拉人形机器人将于 7 月亮相上海 2025 世界人工智能大会  RoboNeo安装教程  MetaGPT AI 模型开源:可模拟软件公司开发过程,生成高质量代码  提高开发效率:AmazonCodeWhisperer与Amazon Glue的集成和生成式AI的应用  报道称亚马逊正在测试AI生成产品评价摘要  央广车联网亮相2025世界人工智能大会  中国气象局预测:到 2030 年,中国人工智能气象应用将达到国际领先水平  美图秀秀发布七款 AI 工具:修图一样修视频、打造电影级上镜脸  干货满满,2025昆山元宇宙国际装备展等你来打卡!  大疆 DJI Mini 4 Pro 无人机曝光:流线设计,有望迎来功能性提升  GPT-4使用混合大模型?研究证明MoE+指令调优确实让大模型性能超群  精准度可提高 20%:英国九家银行签约使用基于 AI 的“消费者欺诈风险系统”应对*  美图公司影像节或发布AI设计新品  这效果能打几分?AI真人化《名侦探柯南》  争鸣:OpenAI奥特曼、Hinton、杨立昆的AI观点到底有何不同?  百度创始人、董事长兼首席执行官李彦宏:AI原生应用比大模型数量更重要  探索人工智能在物联网领域的影响与改变  导演郭帆:人工智能应用可能会影响《流浪地球 3》的创作开发  日新月异,脑机接口技术都有哪些新应用?  静安大宁功能区企业云天励飞亮相2025世界人工智能大会,秀出AI硬实力!  微软向美国政府提供GPT的大模型,安全性如何保证?  AIGC 风潮刮到游戏产业,巨人网络与阿里云达成“游戏 +AI ”合作  套娃不可取:研究人员证实用AI生成的结果训练AI将导致模型退化  智能客服进入AI 2.0时代 容联云发布语言大模型“赤兔”  编程已死,AI 当立?教授公开“唱反调”:AI 还帮不了程序员  印象笔记开放旗下“印象 AI”,可一键生成思维导图、写文章等  普林斯顿Infinigen矩阵开启!AI造物主100%创造大自然,逼真到炸裂  大脚攀爬者车主福利!无人机、运动相机大奖等你来挑战  以计算机视觉技术为基础的库存管理如何改革零售行业  埃森哲俞毅:AI时代我们需要新的“摩尔定律”  时隔 4 年:谷歌更新安卓机器人 LOGO,形象更立体  XREAL Beam 投屏盒子正式发布:支持“可悬停 AR 空间屏”  发布最新版本的 PICO OS 5.7.0:支持VR头盔录屏并跨平台分享至微信 

 2025-11-28

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

运城市盐湖区信雨科技有限公司


运城市盐湖区信雨科技有限公司

运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。

 8156699

 13765294890

 8156699@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.