“降价”上瘾！阿里云宣布通义千问主力模型降价97%

投稿
APP
微信扫一扫获取更多

“降价”上瘾！阿里云宣布通义千问主力模型降价97%

天星资本mp

2024-05-21 15:00:51

图灵汇官网

标题：大模型竞赛：阿里云引领价格战，加速AI应用创新

在AI领域的大模型竞赛中，价格战成为了近期的热点话题。继5月14日OpenAI宣布将其旗舰AI模型GPT-4的价格下调50%之后，国内大模型厂商迅速响应，展开了一系列降价行动，旨在推动AI应用的规模化发展。

阿里巴巴云计算集团在近期宣布，其主打模型通义千问的主力产品Qwen-Long的API输入价格已从0.02元/千tokens降至0.0005元/千tokens，降幅高达97%。这意味着，用户只需花费1元即可获得200万tokens的使用量，相当于购买了5本《新华字典》的文本容量。

在这场价格战中，国产大模型智谱、字节跳动旗下的豆包大模型也相继跟进，降幅在80%至90%之间。其中，豆包的降价更为激进，一块钱可以买到125万Tokens，相当于购买了三本《三国演义》的文本量。

面对这场价格战，业界普遍认为，大模型性能的提升促使AI应用创新进入了一个密集探索期，但高昂的推理成本仍然是制约大模型规模化应用的关键因素。通过大幅降低推理价格，不仅降低了AI应用开发的门槛，还促进了开发者加速参与，增强了AI产品的市场适应性和依赖性。

据阿里云预测，未来大模型API的调用量将呈指数级增长，公共云+API将成为企业使用大模型的主流方式。通义千问的降价覆盖了9款商业化及开源系列模型，进一步推动了这一趋势。

值得一提的是，通义千问旗舰款大模型Qwen-Max的API输入价格也从先前的0.04元/千tokens降至0.04元/千tokens，降幅达到67%。Qwen-Max作为中文大模型中的佼佼者，在性能上与GPT-4-Turbo相匹敌，并在全球大模型竞技场Chatbot Arena中位列前15名。

Qwen-Long作为通义千问的长文本增强版模型，其上下文长度可达1千万，API输入价格和输出价格分别降至0.0005元/千tokens和0.002元/千tokens，显著低于国内外其他厂商的同类产品。

阿里云在价格战中一直扮演着先行者的角色。今年2月，该公司对旗下100多种云产品进行了大幅度降价，平均降幅超过20%，最高达55%，涵盖了计算、存储、数据库等所有核心产品。随后，多家云服务提供商被迫跟进。

在此次降价潮中，阿里云依然处于领跑地位。作为一家云服务供应商，阿里云拥有技术红利和规模效应带来的巨大成本和性能优势。借助自研的核心技术如异构芯片互联、高性能网络HPN7.0、高性能存储CPFS以及人工智能平台PAI等，阿里云构建了一套极致弹性AI算力调度系统，并结合百炼分布式推理加速引擎，有效降低了模型推理成本，提升了推理速度。

从实际测试数据来看，即使是同一款开源模型，在公共云上的调用成本也远低于私有化部署。以每月使用Qwen-72B开源模型、调用量为1亿tokens为例，通过阿里云百炼直接调用API的费用仅为600元，而私有化部署的平均成本则超过1万元。

此外，云服务供应商的开放性使得开发者能够接触到丰富多样的模型和工具链。阿里云百炼平台汇集了国内外优质的模型资源，内置了大模型定制与应用开发工具链，方便开发者快速测试、选择、调整模型，并轻松搭建如知识图谱接入（RAG）等应用。从模型选择、参数优化到应用开发和服务部署，开发者可以实现一站式操作。