“免费”“降价”……9月19日,2024云栖大会上,阿里云发布了多款产品并宣布了新一轮的降价,“阿里云会努力把成本继续降下去”,阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭如此表示。
在这背后,对云厂商来说,行业仍处于AGI变革的早期,大模型的“降价潮”未有结束的迹象。
“过去一段时间,模型推理成本指数级下降,已经远远超过摩尔定律。一年来,通义千问API在阿里云百炼上的调用价格下降了97%,百万 Tokens调用花费最低已经降到了5毛钱。”9月19日上午,吴泳铭在演讲中透露。
而在当日下午,阿里云Qwen-Turbo百万tokens的最低调用花费就被再次刷新到了三毛钱,阿里云智能集团首席技术官周靖人宣布,Qwen-Turbo价格直降85%,Qwen-Plus和Qwen-Max分别再降价80%和50%,阿里云又开启了新一轮的降价。
同时,阿里云还发布了新一代开源模型Qwen2.5,其视觉语言模型Qwen2-VL-72B也正式开源,能识别不同分辨率和长宽比的图片,理解20分钟以上长视频。阿里云通义旗舰模型Qwen-Max也迎来全方位升级,周靖人称其性能接近GPT-4o,通义官网和通义APP的后台模型均已切换为Qwen-Max,“继续免费为所有用户提供服务”。此外,周靖人还宣布通义万相全面升级,并发布全新视频生成模型,这款AI视频制作工具完全免费,”APP端开放每日不限次使用”。
阿里云一连串的动作背后,一个现象是,贴钱引流、拉新仍是大模型行业的常态。
“开源、降价,都是一个逻辑,怎么让生态发展起来。”周靖人在接受记者采访时表示。他称,从去年阿里云坚定做开源开始,过去一年,阿里云看到了模型的生态建设超预期的表现,大模型不再高高在上。截至2024年9月中旬,通义千问开源模型累计下载量已突破4000万。
周靖人表示,阿里云的每一次降价都经过了非常严肃的内部讨论。除了成本,云厂商们更要从整个产业的发展、开发者、企业用户的反馈等各方面进行权衡,通过规模效应、技术进步和资源调度去实现未来成本的进一步降低。从长期发展来看,大模型的能力需要让大家都能用得起,从而激发更多的产业级的创新。吴泳铭也在演讲中表示,模型推理成本是影响应用爆发的关键问题。
“有一个说法是现在的AI相当于1996年左右的互联网,也就是在BBS时代,那时候的上网资费很贵,后来互联网的发展包括移动互联网的发展,运营商大力去搞基建,流量资费降下来。”阿里云副总裁张启表示,阿里云现在也在疯狂地搞AI大基建,把资费降下来,才有可能去谈未来应用的爆发,这个长远的目标才是阿里云考虑更多的问题,“而不是说今天一定要算一个账,马上能够赚多少钱”。
随着大模型降价对毛利的蚕食甚至负毛利,大模型降价的底线在哪里?对此,周靖人表示,阿里云降价主要是通过技术的优化,不光是模型本身的快速迭代,模型的推理效率、结构优化等也在同步进行,以此去推进模型推理成本的进一步下降,阿里云要把技术的红利让利给企业客户,去推动整个产业的发展。
“我们也认识到,今天模型的运用,包括模型各种各样的创新,现在还在早期的阶段。这个时候我们如果把模型的推理放到一个昂贵的阶段,大量的开发者没有办法有效地、批量化地或者大规模地去使用,在一定程度上也会影响到大家(对AGI变革)的重视。”周靖人表示。
AI的算力难题,可以在云上解决
字节跳动称,公司在芯片领域确实有一些探索,但还处于初期阶段。
“真正做大模型的公司,如果你一万张卡都没有,你就根本不要讲自己是在干大模型的公司。”
“我们心中还是很有底气的,但是需要一点时间。”科大讯飞董事长刘庆峰在8月22日的业绩交流会上表示。
演讲围绕四个篇章展开“设计新自我”的商业方法:漫长的正反馈;诚实的原创力;专注的进化论;勇敢的增长观,并现场发布新物种爆炸2024四大主题的12个新商业预测。