“对于每一个企业来说,怎么用好Tokens,是一门必修课。”
作者丨胡敏
编辑丨包永刚
2026年,AI应用的普及让Token消耗量进入指数级增长。但对企业来说,这不是一个抽象的数字游戏,每一笔Token消耗,都是真金白银的算力账单。一家中等规模的AI客服公司,月Token消耗从去年底的几百万飙升到现在的上亿;一家做代码助手的创业公司,半年内Token成本涨了5倍,增速超过了收入。
类似的案例正在各行各业上演。Token用得多,说明业务在增长。但问题也随之而来:Token成本正在吃掉企业利润。很多公司陷入了一个尴尬的局面,业务越火,算力账单越烫手。
本期圆桌,我们聚焦企业视角,邀请三位算力成本一线的实战派,拆解:企业到底怎么才能把Token成本降下来?
01
核心议题
我们将讨论这4个你最关心的问题:
第一,看看大家Token账单都有多夸张?
三位大咖将分享他们亲身经历的“最离谱”消耗案例,那些让你肉疼的数字。
第二,再查查这些“钱”烧在哪?
企业Tokens成本,到底被谁吃掉了?是无效的推理调用、过长的上下文,还是模型架构本身的低效?当前企业对于“降本”这件事,是已有成熟方法论,还是仍在迷茫摸索。
第三,拆解省钱实操路径
我们将从三个维度,一次性讲透降本方法:
使用侧:优化提示词、减少无效调用、控制输出长度……这些“小动作”到底能省多少钱?有哪些反直觉的坑?
采购侧:OpenAI、Anthropic、DeepSeek……模型怎么选?便宜的模型真的更省钱吗?订阅制看似划算,但遭遇“封号”风险怎么办?从厂商直购还是走第三方平台?
技术侧:从模型、工程到硬件,哪些降本路径真正有效?哪些只是看上去美好
第四,解答你对未来的担忧
二级市场担心“Tokens用得越多,利润越薄”,这个担心有必要吗?未来企业Tokens成本会继续快速下降,还是会遇到天花板?
02
圆桌嘉宾
九章云极联合创始人兼COO 尚明栋
尚明栋,毕业于北京航空航天大学和美国雪城大学(Syracuse University),计算机工程等前瞻学术经历为其后的技术生涯奠定了坚实的基础。原微软服务器高可用集群文件系统核心开发工程师, 曾参与发布Windows 7和Windows 8,是SMB 3.0的主要拟草人之一。拥有Continuous Availability over Cluster Failover和Multichannel over SMB 等美国专利,在文件系统和海量数据可靠传输领域具有深厚造诣。
2013年,尚明栋联合创立了九章云极DataCanvas,并担任COO,负责公司人工智能基础设施软件的技术架构、团队管理和智算产品的创新研发,引领公司在智算领域取得显著成果。作为行业内的技术领袖,他以其卓越的创新能力和丰富的行业经验,为推动人工智能技术的发展做出重要贡献。
云天励飞副总裁、智算研究院院长肖嵘
肖嵘,现任深圳云天励飞技术股份有限公司副总裁、兼智算研究院院长,正高级工程师。先后入选国家重大人才工程、深圳市孔雀计划 A 类人才。 肖嵘博士本、硕、博均毕业于南京大学,拥有扎实的学术背景和长期的产业实践经验。
曾任微软研究院高级研究员、微软必应搜索资深软件工程师,以及平安产险人工智能部总经理等职务,在人工智能核心技术研发与规模化应用方面积累了丰富经验。 其主要研究方向涵盖机器视觉、大规模搜索引擎、多模态大模型等领域,长期致力于推动前沿算法向实际场景落地转化。
曾荣获吴文俊人工智能科技进步奖一等奖、微软 ICICLE 奖、平安集团重大创新奖等多项重要荣誉。其主持研发的 OCR 表格识别、人脸识别算法在多项国内外权威比赛中多次夺冠;主导打造的“云天天书”大模型在 C-Eval、CMMLU、MMBench 等权威评测榜单中取得第一名的成绩。
目前,肖嵘博士主持云天励飞智算研究院工作,重点聚焦大模型推理优化与具身智能多模态大模型两个前沿研究方向,持续推动人工智能技术创新与产业化应用。
云器科技联合创始人、CTO关涛
关涛 Tony,云器科技联合创始人/CTO,分布式系统和大数据平台领域专家。
曾任阿里云计算平台事业部研究员,前阿里巴巴通用计算平台MaxCompute、Dataworks负责人,负责阿里巴巴主线大数据平台。前阿里巴巴和蚂蚁集团技术委员会计算平台领域组长、阿里云架构组大数据组组长。
加入阿里云之前,在微软云计算和企业事业部工作 9 年,主持和参与开发了Azure DatalakeAnalytics、Cosmos/Scope等多套超大规模分布式存储和计算平台。并著有多篇国内外会议论文和专利。
03
2026 年 4 月 10 日 14:00(北京时间)
观看平台
视频号 “雷峰网”直播间
扫码预约,看看其他企业是怎么省钱的~