新民晚报记者今天(23日)了解到,全球最大AI模型API聚合平台OpenRouter发布最新数据,截至3月15日,中国AI大模型的周调用量达到4.69万亿Token(词元),连续第二周超越美国。全球调用量排名前三的位置,更是被中国模型包揽。


记者关注到,随着Agent开发工具(如 OpenClaw、Claude Code)的普及,国内大模型厂商正掀起一场针对开发者的“Coding Plan”订阅服务争夺战。

阶跃星辰官宣推出月度Token订阅方案Step Plan。该方案针对OpenClaw及AI Coding场景深度定制。首发支持Step 3.5 Flash,该模型目前在OpenRouter总调用周榜全球第一,及OpenRouter OpenClaw应用月榜调用量全球第一。

阶跃星辰推出的Step Plan设置4个不同档位方案:Flash Mini、Flash Plus、Flash Pro、Flash Max。起步价49元/月,开发者社区限时半价低至25元/月。值得关注的是,Step Plan全档位统一提供高速推理速度,不设“普通版”和“极速版”的区分。在不少同类产品将高速推理作为付费升级项的行业背景下,阶跃星辰选择把极速体验做成标配,让所有用户开箱即享。官方也表示,后续将陆续支持更多模型,进一步扩展到更完整的多模态场景,给开发者带来更多想象空间。

大模型领军企业MiniMax宣布:将此前的Coding Plan升级为Token Plan,即全球首个支持全模态模型的统一订阅计划。升级后,Plus及以上套餐用户在保留M2.7编程模型原有用量的基础上,额外获赠海螺视频、语音合成、音乐生成、图像生成等多模态模型调用额度,无需额外付费。同时面向专业开发者和企业用户推出语音和视频资源包,批量使用价格最高可优惠20%。

就在一周前,MiniMax发布首个参与自身迭代的Cowork Agent模型M2.7,上线后用户规模与调用量快速提升。针对用户激增带来的高并发,平台在工作日高峰时段(15:00—17:30)实施动态限流,以保障大多数Token Plan用户的稳定体验。MiniMax表示, 技术团队正在全力推进算力扩容与系统优化,在保障业内最佳使用体验的同时,为用户带来实惠、可持续的使用体验。

摩根大通预测,中国的AI推理Token消耗量将从2025年的约10千万亿增长至2030年的约3900千万亿,五年间增长约370倍。

在AI的世界里,Token是模型处理信息的最小计量单位,无论是用户的提问,还是AI生成的一段代码,最终都要被拆解成Token来完成运算。正因如此,Token调用量成为衡量AI模型活跃度和产业价值的关键指标,Token调用量越高,意味着模型被用得越多,创造的实际价值也就越大。

原标题:《Token订阅大战打响!阶跃星辰、MiniMax接连出牌,开发者将成赢家》

栏目编辑:陆梓华

来源:作者:新民晚报 郜阳