一夜之间,初创公司Groq爆火,其在同名模型启动器上运行的大模型,能够每秒输出近500个token,输出速度比Gemini快10倍,比GPT-4快18倍。
Groq并没有研发新模型,主页上运行的是开源模型Mixtral 8x7B-32k和Llama 270B-4k。其神速的响应源于自研的语言处理单元LPU。根据Groq官网的介绍,LPU是一种专为AI推理所设计的芯片。
Groq官网的测试资料显示,由Groq LPU驱动的Meta Llama 2模型推理性能是顶级云计算供应商的18倍。Groq创始人Jonathan Ross称,在大语言模型任务上,LPU比英伟达的GPU性能快10倍,但价格和耗电量都仅为后者的十分之一。单卡仅有230MB内存,2万美元一张。
自研芯片速度碾压英伟达10倍 初创公司Groq一夜爆火。点击视频,一看究竟!
近日,全球模型服务平台OpenRouter上线了一款代号为“Pony Alpha”的匿名模型,引发全网关注。据该平台合作方Kilo Code透露,Pony Alpha是“某个全球实验室最受欢迎的开源模型的专项进化版”。这意味着,Pony Alpha更有可能是DeepSeek-V4或者智谱即将发布的新一代模型GLM-5。第一财经记者从知情人士处获悉,智谱目前有相关保密项目在推进中,该神秘模型,是智谱即将发布新一代模型GLM-5。在资本市场表现上,智谱(2513.HK)2月10日股价再创新高,市值一度突破1500亿港元,这一市值已接近其IPO市值的3倍。更现场、更财经,一探究竟!
在全球大模型竞争进入深水区、Transformer架构主导行业发展的当下,中国大模型产业虽在应用层面快速迭代,但核心技术架构仍未脱离美国主导的现有框架。今年的上海两会期间,上海市政协委员、上海熠知电子科技有限公司董事长黄海清,呼吁国内大模型企业团结协作,在多模态大模型、行业垂类大模型等新兴赛道,率先打造自主技术架构与标准体系。
AI热潮席卷全球,那么中国的AI产业是否存在泡沫?瑞银在近期接受第一财经采访中明确表示,当前中国AI发展仍处于早期健康阶段,无需过度担忧泡沫风险。与美国相比,中国以更低的投入实现了可观的模型进步。
2025年起,人形机器人成为A股市场一个众生所知的热门话题,相关概念股持续火热,企业商业化落地进程正在加速。那么人形机器人什么时候才能真正打开消费市场?为此,瑞银在接受第一财经采访时认为,人形机器人降低成本、打开市场的关键不在规模效应、而在技术突破,尤其是“大脑”部分专用AI模型的成熟;而工业侧通用性较低的相关场景或将率先实现规模化落地。