价格战总算打到了AI大模型领域。
5月21日,阿里云首先抛出重磅炸弹:通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%,约为GPT-4价格的1/400。就在几个小时后,百度随即应战,宣布文心大模型两大主力模型全面免费,立即生效。加上此前已宣布降价的智谱AI大模型,及走低价路线的字节自研豆包大模型,至此群雄竞逐的大模型价格战正式进入白热化。
AI大模型被认为是人工智能时代的跨时代工具。自ChatGPT发布以来,国内巨头蜂拥而上,在经历了“大模型元年”的技术累积和场景落地后,开始了新一轮价格比拼。在业内人士看来,此轮大模型降价潮,是厂商希望进一步抢占市场,加速AI应用的商业化落地,这不仅有助于向大众普及AI,也将推动产业的巨变。
阿里百度字节争相降价
大模型定价进入“厘时代”
此轮降价后,大模型定价真正进入了“厘时代”。
据介绍,Qwen-Long是通义千问的长文本增强版模型,性能对标GPT-4,上下文长度最高达1千万。此次降价后,输入价格降至0.0005元/千tokens,即0.5厘/千tokens。
此外,Qwen-Long输出价格也直降90%至0.002元/千tokens。不久前发布的通义千问旗舰款大模型Qwen-Max,API输入价格降至0.04元/千tokens,降幅达67%。

不过,从5月初开始,各家就已在AI大模型价格上开始较劲。
5月6日,幻方量化旗下DeepSeek发布第二代MoE模型DeepSeek-V2,该模型API定价为每百万Tokens输入1元、输出2元(32K上下文),价格为GPT-4 Turbo的近百分之一。几天后,智谱大模型官宣新的价格体系,入门级产品GLM-3 Turbo模型调用价格从5元/百万Tokens降至1元/百万Tokens,降幅达80%。
随后,字节跳动旗下云服务平台火山引擎自研的豆包主力模型对外披露定价,
其通用模型 pro-32k 版模型推理输入价格为0.0008元/千Token。
就在各家“交战正酣”之时,5月21日下午,百度在其公众号发文称,文心大模型两大主力模型ERNIE Speed和ERNIE Lite全面免费。

同样的“价格战”,也在国外开打。OpenAI在5月13日发布的GPT-4o,不仅在功能上大幅超越GPT-4 Turbo,价格只有其一半,为5美元/百万tokens。而2023年年初以来,OpenAI也已进行了4次降价。而谷歌旗下Gemini大模型系列中,Gemini 1.5 Flash 的价格为0.35美元/百万tokens,比GPT-4o还要便宜得多。至此,国内外科技巨头围绕AI大模型的价格竞争已经全面展开。
按照OpenAI的预期,大模型将按照每年50-75%幅度继续降本。不过,目前,现在大模型的降本速度远超预期。
规模效应带来降价潮
或加速AI应用爆发
过去,大模型推理成本下降,很大程度要依赖于算力的升级。那么,这一轮驱动这轮大模型推理成本下降的逻辑是什么?
业界普遍认为,随着大模型性能逐渐提升,AI应用创新正进入密集探索期,但推理成本过高依然是制约大模型规模化应用的关键因素。
“降低大模型推理价格,就是希望加速AI应用的爆发。”阿里云智能集团资深副总裁、公共云事业部总裁刘伟光预计,调价后,未来大模型API的调用量会有成千上万倍的增长。
在刘伟光看来,公共云的技术红利和规模效应带来巨大的成本和性能优势,进而大幅压缩了模型推理成本,并加快模型推理速度。他给记者算了一笔账,同样的开源模型,在公共云上的调用价格也远远低于私有化部署。“以使用Qwen-72B开源模型、每月1亿tokens用量为例,在阿里云百炼上直接调用API每月仅需600元,私有化部署的成本平均每月超1万元。”
几次工业革命的已告诉人类,科技变革本质上都是伴随着边际成本的大幅下降,进而推动了技术的扩散。有业内人士表示,AI大模型纷纷降价一方面有助于大众普及AI,另一方面也是顺应市场需求。“由于OpenAI也走的是先进模型高额收费,低版本模型逐渐免费的路;目前,GPT3.5已经免费,而中国目前最好的模型也只处于GPT3.5-4之间的水平,不低价没有任何竞争力。”
降低了入门门槛
云+API将成大模型使用主流方式
值得注意的是,这轮降价的AI大模型都是通用大模型,其要落地使用需要通过API网络接口向各场景应用提供服务。此轮降价后,是否意味着中国大模型API的商业模式就无限趋近于不存在了?
有业内人士分析称,感觉这种形式上的免费确实降低了商业客户的入门门槛,但目前看各种细节条款,真的高质量、大规模、高并发用起来肯定还是要收钱的。
刘伟光也认为,不管是开源模型还是商业化模型,公共云+API将成为企业使用大模型的主流方式。“因为云厂商天然的开放性,能为开发者提供最丰富的模型和工具链,让开发者从选模型、调模型、搭应用到对外服务一站式搞定。”
这意味着,AI大模型的此轮价格战主要对C端用户有用,在B端开发者而言意义并不大。
对于AI大模型而言,从比算力到比价格也就一年的光景。巨头们在价格上的连锁反应,影响深远。“可以清晰地看到,如果彼此技术拉不开差距,价格也一定拉不开差距,最终价值还是会逐渐趋近于零。”分析人士称,虽然依旧是重要的基础设施,但价值上就从“油”变“水”了。
“此外,还有一种可能是,新一代应用是靠‘水电’长起来的,甚至是被‘水电厂’们投资扶持的。”该分析人士预测,如果中小厂商通过自研等方式有了自己的模型能力,甚至变成“核电”,AI大模型产业的巨变也会由此到来。
发表评论 取消回复