中美AI打响价格战，英伟达竟成最大赢家？

2024-05-24 11:01

imToken - 全球领先的去中心化钱包

推荐下载 领取价值高达 6,0000 元的数字货币盲盒，享受 20%手续费减免。提供安全、可信赖的非托管钱包服务！

立即下载 APP推荐

文章来源： AI科技大本营
整理 | 王轶群
责编 | 唐小引

图片来源：由无界AI生成

5月，大模型降价忙。
AI 降价潮愈演愈烈，国内国外都开启了新一轮的 AI 价格战。

国内AI价格激战：降价、大幅降价、直接免费！

国内互联网大厂，包括阿里、字节、百度、腾讯，以及背靠雄厚资本的创业公司，持续发布 AI 及大模型产品，同时逐步加快了降价的节奏，从降价、大幅降价，到直接免费、立即生效！

事情开始于1元可以购买100万tokens。

5月6日，私募巨头幻方量化的AGI（通用人工智能）的新组织“深度求索（DeepSeek）”开源第二代 MoE 模型 DeepSeek-V2，把价格打到了仅为GPT-4-Turbo的近百分之一。其API的定价为：每百万tokens输入1元、输出2元（32K上下文）。

5月13日，智谱大模型开放平台上线了新价格体系，入门级产品 GLM-3 Turbo 模型调用价格下调80%，从5元/百万tokens降至1元/百万tokens。调整后，1元可以购买100万tokens，使用 GLM-3 Turbo 创作一万条小红书文案（以350字计）将仅需约1元钱。

大厂也同样不甘示弱。

5月15日，字节跳动发布豆包大模型，定价大幅低于行业价格。豆包主力模型在企业市场的定价仅为0.0008元/千tokens，即0.8厘就能处理1500多个汉字，比行业便宜99.3%。

在5月9日发布通义千问2.5之时，阿里表示个人用户可以通过 APP、官网和小程序免费使用通义。而不到两周后，在5月21日，阿里通义千问开启降价。由此，1元可以购买100万tokens，被阿里卷到1元最多可购买200万tokens。

通义千问 Qwen-Long 的 API 输入价格大幅下调，从0.02元/千tokens降至0.0005元/千tokens，直降97%。这意味着1元钱可以购买200万tokens，相当于5本《新华字典》的内容。该模型最高支持1000万tokens的长文本输入降价后的价格约为 GPT-4 的1/400。

阿里的这波降价加限时免费，一定程度上已经超越了前几次其他厂商的大模型降价。但，这并没有让阿里坐稳价格战的头把交椅，甚至屁股都没坐热，就被打着“全面免费”的百度赶下。在阿里宣布如此大幅降价的当日，5月21日晚些时候，百度宣布文心大模型的两大主力模型将全面免费，立即生效。

之前咬紧的降价潮，被百度再卷一次，迎来了全面免费的阶段，国内大模型价格战的正式打响。

随后，仅在第二天，全面免费风头就归属到了卷王腾讯云。5月22日，腾讯云直接“一键三连”：正式对外宣布旗下AI代码助手全面对外开放，公布了全新大模型升级方案，API 输入价格大幅下降，混元-lite模型全面免费。

腾讯云主力模型之一混元-lite 模型，API输入输出总长度计划从目前的4k升级到256k，价格从0.008元/千tokens调整为全面免费；混元-standard API 输入价格从0.01元/千tokens降至0.0045元/千tokens ，下降55%，API输出价格从0.01元/千tokens降至0.005元/千tokens，下降50%；混元-standard-256k，具备处理超过38万字符的超长文本能力，API输入价格下调至0.015元/千tokens，下降87.5%，API输出价格下降至0.06元/千tokens，下降50%；最高配置万亿参数模型混元-pro，API 输入价格从0.1元/千tokens降至0.03元/千tokens，降幅达70％。

腾讯云表示，以上价格调整自发布之时立即生效。

国内的 AI 价格战，在本周打得尤为激烈。不仅模型参数及性能卷起来了，价格更是卷到飞起！从1元可购买100万个tokens，到最多可买200万个，再到免费，最后到全面免费。甚至有业内人士笑称，眼瞅着下一家跟进的厂商可能就得发钱补贴让客户用 API 了。

国外AI：扎堆发布、降本至免费，英伟达坐收渔翁之利

在国内降价免费之前，国外已经走过了一轮大模型降价和免费阶段。

5月初，谷歌就表示其AI聊天机器人的问答成本在过去一年中锐减了80%。这标志着谷歌在 AI 领域再次取得了重要突破，通过 Gemini AI 模型和定制AI芯片的技术革新，谷歌有效降低了 AI 搜索的运营成本。

不仅降本，谷歌还直接免费。一个月前，在4月10日，谷歌最强大模型Gemini 1.5 Pro“全面”对外开放，完全免费。Gemini 1.5 Pro100万的上下文窗口这次也直接对外开放，可以处理的最长音频约为11小时，最长视频则为1小时。谷歌官方给这次免费开放的Gemini 1.5 Pro版本定义为“公开预览版”，主要面向开发者，可在谷歌AI Studio中获得API密钥。这是在 Gemini Ultra 免费试用两个月之后的又一次大模型免费举动。

搅动浑水的鲶鱼，非 OpenAI 莫属。偏偏赶在谷歌 I/O 大会同一时间的前一天，在5月13日，OpenAI 推出了一款名为 GPT-4o 的“旗舰级”生成式人工智能模型，面向所有 ChatGPT 的付费和免费用户，取消其他所有限制，API 价格降价50%。

OpenAI这波对谷歌的阻击力度不小。虽然OpenAI宣传的是“取消所有限制”，但据使用者反馈，也存在每天的使用限制。其免费层的用户将默认使用GPT-4o，但使用 GPT-4o 发送信息的数量有限制，这将根据当前的使用情况和需求而变化。不可用时，免费层用户将切换回GPT-3.5。

第二天，谷歌 I/O 大会以近10个大模型的升级发布绝地反击。

谷歌向全球所有开发者推出 Gemini 1.5 Pro 的改进版本，拥有 100 万个 token 上下文的 Gemini 1.5 Pro 现在可以直接在 Gemini Advanced 中供消费者使用；将 Gemini 1.5 Pro 上下文窗口扩展到了 200 万个 tokens，并以私人预览版的形式提供给开发人员；比 Gemini 1.5 Pro 更轻量级的 Gemini 1.5 Flash 发布；发布可制作“高质量” 1080p 视频的 Veo 模型和文本生成图像模型 Imagen 3；发布采用全新架构、27B 大小尺寸的 Gemma 2.0；推出第一个视觉语言开放模型 PaliGemma。

一周后，微软在 Build 开发者大会上也频频出招。仅仅在第一天两个多小时的演讲中，微软就宣布了50多项更新，包括AI基础设施、模型产品落地等多方面。

在谷歌预览具备语音交互和视觉记忆的AI智能体 Project Astra 后，微软在会上发布 Team Copilot 智能体，作为 Copilot for Microsoft 365 的扩展，该智能体更注重在执行工作任务上，能够提升整个团队的工作效率，完成主持会议、跟踪并安排项目进展等任务。同时，微软宣布将 OpenAI 上周更新的ChatGPT-4o接入Azure云平台，可对外提供API。在垂直领域应用上，微软还与可汗学院合作为 K-12 教师免费提供人工智能Agent，并将开发 Phi-3 数学模型。

在国外，无论是行业应用还是基础模型，国外大模型的市场份额都牢牢被明星创业公司和大厂占据，要么是 OpenAI、谷歌、Meta 等科技巨头，要么是有传统科技巨头大手笔投资的 Anthropic、Mistral AI 等明星初创公司。

然而，占据大部分市场份额的AI公司，其盈利能力却一直不达预期。连 Meta 这样的巨头也无法指望立刻从AI中获利，Meta 在2024年增加了高达100亿美元的基础设施支出，但预计多年内不会从其 AI 产品中赚钱。

那么，AI 浪潮仍在激烈奔涌下，真正赚钱的是谁？算力巨头英伟达坐收渔翁之利。在最新公布的财报中，英伟达获得了创纪录的季度收入。据其发布截至4月28日的2025财年第一财季报告，各项数据全面超越预期的状态。

英伟达第一季度实现收入260亿美元，比去年同期增长262%；净利润为148.8亿美元，同比增长高达644%。英伟达预计，截至7月的本季度营收将达到280亿美元，是去年同期的两倍多，也高于华尔街的预期。

在随后的电话会议上，首席财务官科莱特·克雷斯预计，每花费1美元采购英伟达人工智能基础设施，云提供商在未来四年内就有机会通过提供算力服务（GAAS）赚取5美元收入。

可见，在算力和数据这开发大模型无法绕过的两大难点上，占一头的优势，英伟达就获利颇丰。

谁在获益，谁在被裹挟，免费保增长还是收费报成本？

增算力，获数据，扩市场，这是成为时代 AI 基建的底层逻辑。

目前，算力层面英伟达一家独大。AI模型厂商的眼光就瞄准在了市场、用户和数据规模上。降价，免费，多性能多产品，即为保增长的获客之道。

事实上，降价并没有真的损失多少收入，毕竟大家都没有英伟达赚钱，都没完全跑通商业模式。激活下市场，在行业降价潮中及时入场赚个吆喝，促进企业从“免费试用”开始下水，扩大大模型API的调用量，有助于早点启动大模型发布公司对 AI 进入业务流的尝试。

过去一年，国内大模型厂商在过去一年也做了一系列探索来降低 AI 应用的门槛，以期扩大大模型的调用量，但结果都不及预期，标准化的模型 API 并没有迎来确定性的增长，不如直接降价、免费来得直接。

降价免费，降低使用门槛，促使更多用户使用、更多的API调用，就能带来更大市场，获取更多数据。
数据是AI模型的基础，AI 模型训练获取适合数据的难点和痛点在于：

数据获取难，物理层等数据源缺失，应用难展开，采集数据颗粒度不统一，数据难应用；
数据质量差，数据记录不完整，应用难优化，数据记录不准确，应用难商用；
数据训练成本高昂。

根据HAI研究所的AI报告，训练巨型模型的成本呈指数级增长，谷歌 Gemini Ultra 的训练成本估计为1.91亿美元，GPT-4 的训练成本估计为7800万美元。

降价和免费，也是获取更多可筛选训练优质数据的方式之一。科技博主宝玉表示，现在 AI陷入价格战了，AI服务商都陷入了免费保增长还是收费保成本的两难境地。

免费保增长，还是收费保成本？明显，大厂的选择是先降低使用门槛，然后逐步实现商业化。可以看到，本次降价中，降得最凶的都是有云服务的大公司。“这些云服务商通过大模型来获取云用户，羊毛出在猪身上，降得起。”傅盛表示。

想收费保成本的小厂正在这波降价潮中面临尴尬。大厂和明星创业公司可以随意降价，但由此引发的市场竞争加剧，普通 AI 大模型创业者就被裹挟其中。

科技巨头凭借雄厚的财力、广泛的数据存储库和大量的算力基础设施，在底层模型上可以建立牢固的立足点，明星创业公司背后站着明星投资机构。而初创公司，除非依靠大公司的财力，几乎没有能力承担模型的高训练成本，也没有先发优势，不能跟大厂直接对抗，除非瞄准差异化需求，做垂直细分的赛道，否则很难在裹挟中前进。

目前，行业能形成价格战的连锁反应，也由于当前各大模型的能力放在可用的场景中，尚未拉开差距，用户可选择空间大，甚至有免费开源产品可用。也有质疑声音称一些降价的模型本身吞吐量就低，而高性能模型并没有降价，且还有很多细节条款会让最终企业用起来没有宣传的那么便宜。

需要注意的是，只提供模型的 API，距离 AI 应用在场景中落地还有很大距离，大部分 AI 应用还需要在一个通用的模型 API 之上，在场景里喂数据、做微调等来优化模型引擎。

若一个通用的模型 API 无法深度适配场景，企业用户往往还是要自己基于开源模型，用场景数据做专门的深度训练，并不会接通用的模型 API。无论使用门槛再低，如果与用户需求不适配，依然换不来增长。
卷价格来的直接，但不如卷精准符合用户的需求来的实在且长久。

参考链接：
https://mp.weixin.qq.com/s/HA4RtjXvUhOY-sdHXYvUpg
https://baijiahao.baidu.com/s?id=1799742413819805747&wfr=spider&for=pc
https://baijiahao.baidu.com/s?id=1799762991336129582&wfr=spider&for=pc