上个月我用Claude 3 Haiku跑了一批商品描述,10万条,总token量大概700万input、80万output。账单出来:7.3美元。同样的活儿,用GPT-3.5 Turbo花了11.2美元。之前我一直觉得Claude更贵,这个数字把我打醒了。
一张表看清Claude 3全系价格
先把最新价格摆出来,这是截至2025年6月的API定价,单位是每百万token的美元:
| 模型 | 输入价格 | 输出价格 |
|------|---------|--------|
| Claude 3 Haiku | $0.25 | $1.25 |
| Claude 3 Sonnet | $3.00 | $15.00 |
| Claude 3 Opus | $15.00 | $75.00 |
输出token比输入贵得多,这是所有大模型的共性——推理计算量更大。但Claude的价差拉得特别开:Haiku的输出是输入的5倍,Opus也是5倍,Sonnet也是5倍。对比GPT-4 Turbo,输出价大概是输入的2倍。你如果做的是“少量输入、大量输出”的任务——比如长文生成、代码补全——Claude的成本结构对你明显不利。
我之前用Sonnet写过一批技术博客的初稿,就是吃了这个亏。每篇提示词就200多token,但输出经常飙到2000 token以上,账单比我预想的高了40%。后来我全部改用Haiku做初稿,Sonnet只做润色,成本直接砍到原来的1/6。具体怎么操作的,我在Claude SEO优化实战里拆过完整的prompt chain,这里不展开。
别被“百万token单价”糊弄了
大部分人看到$0.25/百万token没啥感觉,我换个说法:用Haiku生成一篇1500字的推文,成本大概0.0006美元。对,0.06美分。这意味着你花1美元可以生成1600多篇。这么看,Haiku几乎不要钱。
但这里有两个坑。
第一个:Haiku的输出质量跟Sonnet、Opus不在一个量级。我做过一个内部测试,拿100条电商评论让三个模型分别写回复。Haiku的可用率只有67%,改一改才能用;Sonnet是91%;Opus是96%。也就是说,你用Haiku省下来的API费,会变成人工审核和改写的时间成本。如果你团队时薪不低,这笔账就不一样了。
第二个:任务复杂度会吃掉价格差。我跑过一次复杂JSON结构化输出,提示词包含200多行schema和示例。同样一个任务,Haiku请求成功率只有78%,剩下的22%要么格式错,要么漏字段。Sonnet成功率98%。你必须给Haiku重试次数,算下来实际token消耗多了不少,把价差吃回去大半。
所以选模型不是看单价,是看“端到端可用成本”。我的经验是:简单分类、短文本补全、草稿生成用Haiku;需要逻辑链或结构化输出的用Sonnet;Opus除非你做的任务跟人命有关,否则没必要。
Claude的价格是怎么定的?
Anthropic的定价逻辑跟OpenAI完全不同。GPT系列更倾向于摊薄研发成本,所以GPT-4 Turbo的输入价格定得极低($0.5/百万token)。Claude走的是测算任务消耗+服务溢价路线。
我研究过他们公布的架构特点:Claude做了大量RLHF后训练和持续的宪法式对齐,推理时有额外的安全层,这些都会增加推理延迟和算力消耗。同样一个70B左右的模型,Claude的推理成本可能比开源模型高20%~30%。我在大模型推理延迟优化里写过,延迟和成本是跷跷板的两端,Claude选择了安全,用户就得付这份溢价。
这对你的采购决策意味着什么?如果你的业务对准确度和安全性要求没那么高,Claude的溢价对你没有价值。国内不少团队开始转向备案过的开源模型微调版本,成本能压到Claude的1/20。我在北京AI大模型备案分析里提到过,242个备案模型里有大量垂直调优版本,它们的百万token价格已经卷到了$0.05以下。Claude如果不降价,明后年在中文场景会很难受。
我现在的用模组合
说直接点:我日常调API不会只用Claude。现在的组合是这样的:
我不会把Claude当成全栈方案,也不会因为它贵就不用。我把它当成工具链里贵但有用的一环——跟买一把150块钱的镊子一个道理,需要的时候没有,成本更高。
这个圈子变化太快,以上价格数据到2025年6月大概率会变,但定价逻辑和方法论不会变。你看完别记价格,记我怎么算账的就行。