分享到微信

打开微信，点击底部的“发现”，
使用“扫一扫”即可将网页分享至朋友圈。

阿里巴巴开源新一代通义千问模型Qwen3

第一财经 2025-04-29 07:04:56 听新闻

作者：一财科技责编：张骁

千问3是“混合推理模型”，“快思考”与“慢思考”集成进同一个模型，对简单需求可低算力“秒回”答案，对复杂问题可多步骤“深度思考”，节省算力消耗。

4月29日凌晨，阿里巴巴开源新一代通义千问模型Qwen3（简称千问3），参数量为DeepSeek-R1的1/3，成本大幅下降。千问3是“混合推理模型”，“快思考”与“慢思考”集成进同一个模型，对简单需求可低算力“秒回”答案，对复杂问题可多步骤“深度思考”，节省算力消耗。

千问3总参数量235B，激活仅需22B。阿里称仅需4张H20即可部署千问3满血版，显存占用仅为性能相近模型的三分之一。

千问3模型版本包含2款30B、235B的MoE模型，以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。API可按需设置“思考预算”（即预期最大深度思考的tokens数量），进行不同程度的思考，满足AI应用和不同场景对性能和成本的多样需求。比如，4B模型面向手机端，8B可在电脑和汽车端侧部署应用等。

第一财经广告合作，请点击这里

此内容为第一财经原创，著作权归第一财经所有。未经第一财经书面授权，不得以任何方式加以使用，包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。
如需获得授权请联系第一财经版权部：banquan@yicai.com