全局概览:两条赛道,一场博弈
2026/6/25 13:17:02 网站建设 项目流程
  • 按量计费(API):以 token 为单位付费,适合开发者,成本透明
  • 订阅制(Consumer):月付/年付,固定费用解锁配额,适合个人和非技术用户

2026 年最显著的趋势:国产模型在 token 使用量上已全面超越美国。

据 OpenRouter 数据,2026 年 3 月 30 日至 4 月 5 日一周内,中国模型处理12.96 万亿 tokens,美国模型仅3.03 万亿 tokens。全球 token 消耗量前六名全部来自中国


二、全球 Token 使用量排行榜

数据来源:OpenRouter Rankings · OpenRouter 2025 State of AI

排名模型厂商周 Token 量(估算)主要优势
1MiMo-V2.5-Pro小米~4.79T1T 参数 MoE,1M 上下文
2Kimi K2.6Moonshot AI~1.4T编码榜第一,256K 上下文
3DeepSeek-V4-FlashDeepSeek极低成本,1M 上下文
4Qwen 系列阿里巴巴多尺寸覆盖,开源生态
5GLM-5智谱 Z.AI中高国内首个上市大模型公司旗舰
6Claude Sonnet 4.6AnthropicSWE-bench 标杆,综合能力领先
7Gemini 3.1 FlashGoogle速度快,价格低,多模态
8GPT-5.5OpenAI生态最广,品牌溢价高
9MiniMax-M2.5MiniMax音视频多模态领先
10Grok 4xAI低中实时 X 数据,推理强

关键数据

时间中国模型美国模型全球总量
2025-05(首次超越)4.12 万亿2.94 万亿
2026-03-30 ~ 04-0512.96 万亿3.03 万亿27 万亿

中国模型在 OpenRouter 平台占比从 2025 年初 <2% 升至 2026 年 Q2>45%。DeepSeek 开源份额从 ~80% 降至 ~40%,被 Qwen、MiMo 分流。


三、国内 TOP 5 大模型套餐

3.1 DeepSeek

官网:chat.deepseek.com ·API 文档:api-docs.deepseek.com ·主体:深度求索(杭州)

DeepSeek 以极低 API 价格和顶级推理能力著称,颠覆美国主导的定价体系。

用户端
套餐价格说明
免费版¥0全部功能,含 DeepSeek-V4-Flash 和深度思考
订阅制官方不提供消费者月付套餐

差异化策略:超低 API 价格服务开发者,消费端完全免费获客。

API 计费(/1M tokens)
模型输入缓存命中输出上下文
DeepSeek-V4-Flash$0.14$0.0028$0.281M
DeepSeek-V4-Pro(折扣 75%)$0.435$0.003625$0.871M
DeepSeek-V4-Pro(原价)~$1.74~$3.481M
DeepSeek-V3(旧)~$0.20128K

75% 折扣有效期至 2026-05-05 15:59 UTC,来源:The Next Web

优点:免费版功能完整 · API 价格全球最低之一(比 GPT-5.5 便宜 35-100x)· 开源可本地部署

缺点:无消费者订阅套餐 · 高峰期偶发不稳定 · 无多模态 · 实时信息有限


3.2 Kimi(Moonshot AI)

官网:kimi.moonshot.cn(国内)/ kimi.com(国际)·主体:月之暗面(北京)

超长上下文见长(最高 200 万字),知识工作者首选。

用户端
套餐月付年付主要权益
Free$0$0基础对话,有每日限额
标准套餐~$19更优惠更高频次,优先响应
高级套餐多档位最高省 $480全部功能,最高配额

国内版(人民币):¥0 – ¥399,以 kimi.moonshot.cn 页面为准。

Kimi Code 开发者套餐
  • 输出速度:最高100 tokens/s
  • 5 小时 token 配额,约 300–1,200 次 API 调用
  • 最大并发:30
API 计费
模型输入/1M输出/1M上下文
Kimi K2.6$0.60$2.50256K

比 GPT-5.4 便宜 4-17x,比 Claude Sonnet 4.6 便宜 5-6x。

优点:超长上下文(国内最高 2M)· 文档解析强(PDF/Word/Excel)· 编码能力全球前列

缺点:免费版限额严格 · 套餐描述不透明,需登录查看 · 多模态能力较弱


3.3 智谱清言 / GLM(Z.AI)

官网:chatglm.cn ·开发者平台:bigmodel.cn / docs.z.ai ·主体:智谱 AI(北京),国内首家上市 AI 大模型公司

GLM-5 于 2026 年 2 月发布,性能达全球前列。

用户端
套餐价格说明
免费版¥0基础对话
会员版官网为准更高配额,优先 GLM-5
GLM Coding Plan$18/月支持 Claude Code、Cursor、Cline

面向开发者,性价比最高的 Claude-alternative 订阅之一。来源:GLM Coding Plan 2026

API 计费
模型输入/1M输出/1M上下文
GLM-5$1.00$0.20200K
GLM-5-Code$1.20–$5.00$0.30128K
GLM-4.7$0.60
GLM-4.5 系列低成本

优点:国内合规性最强 · GLM-5 性能全球前列 · Coding Plan 对开发工具支持度高 · 企业级服务体系完整

缺点:消费端套餐不透明 · API 价格高于 DeepSeek · 国际化知名度低 · 低档套餐联网受限


3.4 MiniMax

官网(海螺 AI):hailuoai.com ·开发者平台:platform.minimaxi.com ·主体:MiniMax(上海)

音视频多模态能力著称,MiniMax-M2.5 开源运行成本约$1/小时

用户端
套餐价格说明
免费版¥0基础对话,图像生成有限额
会员版官网为准更高配额,AI 视频生成

以音视频内容创作为核心卖点,适合创意工作者。

API 计费
模型输入/1M上下文参数
MiniMax-M2.5~$0.30200K230B(10B active MoE)

优点:音频合成(TTS)和视频生成能力领先 · MoE 架构运行成本极低 · 多模态综合

缺点:纯文本能力略弱于 DeepSeek/Kimi · 品牌知名度低 · 套餐信息更新不及时


3.5 小米 MiMo

官网:mimo.mi.com ·主体:小米集团

2026 年 token 用量增速最快,V2.5-Pro 以 1.02T 参数 MoE 架构登顶 OpenRouter 周度用量第一。

用户端(TokenPlan)
套餐月付说明
入门档¥39/月88% 首购折扣,轻度使用
进阶档多档位月付/年付,积分制
企业档定制专属资源,高并发

TokenPlan 积分制比传统按次计费更灵活。API 完全兼容 OpenAI 和 Claude 格式。

API 计费
模型输入/1M上下文特点
MiMo-V2-Pro$1.001MSWE-Bench 78%
MiMo-V2.5-Pro$1.001MOpenRouter 用量第一
MiMo-V2-Flash免费(限额)开源轻量

优点:OpenRouter 用量全球第一(~4.79T)· API 价格极具竞争力 · 1M 超长上下文 · TokenPlan 灵活

缺点:品牌积累时间短 · 消费端产品体验待完善 · 主要优势集中在 API


四、海外 TOP 5 大模型套餐

4.1 ChatGPT(OpenAI)

官网:chatgpt.com ·定价:openai.com/chatgpt/pricing

全球用户量最大,2026 年 4 月推出 GPT-5.5,套餐扩展至六档。

订阅套餐
套餐月付年付主要功能
Free$0$0GPT-4o-mini,有限额,无图像生成
Go~$8轻量付费,休闲用户
Plus$20GPT-5.5,扩展图像生成,优先响应
Pro(低档)$100更高配额,高级推理模型
Pro(高档)$200近无限制,全模型访问
Business$20/seat年付管理后台,SAML SSO,数据隐私
Enterprise定制定制500+ 人团队,最高合规

2026-04 更新:Business 降至 $20/seat;Pro 新增 $100 入门档;GPT-5.5 成为 Plus 及以上默认模型。

API 计费
模型输入/1M输出/1M
GPT-5.5$1.75$14.00
GPT-5 mini$0.25$2.00
GPT-5 nano$0.05$0.40

优点:全球用户量最大,生态最完善(插件、GPT Store)· 套餐灵活,$8 覆盖轻度用户 · GPT-5.5 综合能力强

缺点:$200 Pro 性价比争议大 · API 价格偏高 · 国内需FQ · Plus 高峰期降速


4.2 Claude(Anthropic)

官网:claude.ai ·定价:anthropic.com/pricing

代码能力和安全性著称,Claude Code 是 SWE-bench 评分最高工具(~80.9%)。

订阅套餐
套餐月付主要功能
Free$0基础对话,无 Claude Code
Pro$20标准配额,含 Claude Code
Max 5x$100Pro 的 5 倍配额
Max 20x$200Pro 的 20 倍,Opus 4.6,1M 上下文
Team$25–30/seat最少 2 人,协作,Cowork(2026-01 上线)
Enterprise定制高合规,专属支持
API 计费
模型输入/1M输出/1M上下文
Claude Opus 4.6$5.00$25.001M
Claude Sonnet 4.6$3.00$15.00200K
Claude Haiku 4.5$1.00$5.00200K

优点:SWE-bench 最高分 · Claude Code 最强终端编码代理 · Max 套餐对重度用户友

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询