
{{aisd}}
AI生成 免责声明
北京时间3月18日凌晨,马斯克旗下xAI公司宣布正式开源Grok-1大模型及该模型的权重和网络架构。官网介绍称,Grok-1是3140亿参数的混合专家模型,是“迄今为止全球参数量最大的开源大语言模型。”
xAI曾在2023年11月推出第一代大语言模型Grok,最初版本Grok-0拥有330亿参数,紧接着推出经过数次改进的Grok-1,为X上的Grok聊天机器人提供支持。
xAI称,此次开源版本为Grok-1在2023年10月完成预训练阶段时的基础模型数据,未针对任何具体任务进行微调。去年10月,xAI团队利用定制的训练技术栈,在JAX和Rust的基础上,从零开始构建了此模型。
xAI已将Grok-1的权重和架构在软件托管平台GitHub上开源,根据Apache 2.0许可协议,用户可以自由使用、修改和分发软件,无论是个人还是商业用途。
当天,马斯克不忘在社交平台再次嘲讽OpenAI一番,他发文称,“我们想了解更多OpenAI的开放部分。”
马斯克正式开源Grok-1!3140亿参数成迄今最大开源大模型。点击视频,一看究竟!
近期,开源AI智能体OpenClaw(俗称“龙虾”)全球火爆出圈,直接带动中国大模型MiniMax调用量迎来暴涨。MiniMax相关负责人向第一财经记者表示,过去一个月,其在AI模型聚合平台OpenRouter的调用量,达到了7.5T Token。在该负责人看来,“龙虾”OpenClaw当前的渗透率还很低,未来仍具备较大增长潜力。
近日,全球模型服务平台OpenRouter上线了一款代号为“Pony Alpha”的匿名模型,引发全网关注。据该平台合作方Kilo Code透露,Pony Alpha是“某个全球实验室最受欢迎的开源模型的专项进化版”。这意味着,Pony Alpha更有可能是DeepSeek-V4或者智谱即将发布的新一代模型GLM-5。第一财经记者从知情人士处获悉,智谱目前有相关保密项目在推进中,该神秘模型,是智谱即将发布新一代模型GLM-5。在资本市场表现上,智谱(2513.HK)2月10日股价再创新高,市值一度突破1500亿港元,这一市值已接近其IPO市值的3倍。更现场、更财经,一探究竟!
在全球大模型竞争进入深水区、Transformer架构主导行业发展的当下,中国大模型产业虽在应用层面快速迭代,但核心技术架构仍未脱离美国主导的现有框架。今年的上海两会期间,上海市政协委员、上海熠知电子科技有限公司董事长黄海清,呼吁国内大模型企业团结协作,在多模态大模型、行业垂类大模型等新兴赛道,率先打造自主技术架构与标准体系。
AI热潮席卷全球,那么中国的AI产业是否存在泡沫?瑞银在近期接受第一财经采访中明确表示,当前中国AI发展仍处于早期健康阶段,无需过度担忧泡沫风险。与美国相比,中国以更低的投入实现了可观的模型进步。