首页 > 视听 > 此刻

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

自研芯片速度碾压英伟达10倍 初创公司Groq一夜爆火

第一财经2024-02-21 13:51:15

作者:视点    责编:陈东达

一夜之间,初创公司Groq爆火,其在同名模型启动器上运行的大模型,能够每秒输出近500个token,输出速度比Gemini快10倍,比GPT-4快18倍。

Groq并没有研发新模型,主页上运行的是开源模型Mixtral 8x7B-32k和Llama 270B-4k。其神速的响应源于自研的语言处理单元LPU。根据Groq官网的介绍,LPU是一种专为AI推理所设计的芯片。

Groq官网的测试资料显示,由Groq LPU驱动的Meta Llama 2模型推理性能是顶级云计算供应商的18倍。Groq创始人Jonathan Ross称,在大语言模型任务上,LPU比英伟达的GPU性能快10倍,但价格和耗电量都仅为后者的十分之一。单卡仅有230MB内存,2万美元一张。

自研芯片速度碾压英伟达10倍 初创公司Groq一夜爆火。点击视频,一看究竟!


 

举报

文章作者

相关视频
00'22''

神秘模型霸榜全球模型服务平台 知情人士:该模型是智谱即将发布的GLM-5︱一探

近日,全球模型服务平台OpenRouter上线了一款代号为“Pony Alpha”的匿名模型,引发全网关注。据该平台合作方Kilo Code透露,Pony Alpha是“某个全球实验室最受欢迎的开源模型的专项进化版”。这意味着,Pony Alpha更有可能是DeepSeek-V4或者智谱即将发布的新一代模型GLM-5。第一财经记者从知情人士处获悉,智谱目前有相关保密项目在推进中,该神秘模型,是智谱即将发布新一代模型GLM-5。在资本市场表现上,智谱(2513.HK)2月10日股价再创新高,市值一度突破1500亿港元,这一市值已接近其IPO市值的3倍。更现场、更财经,一探究竟!

85 02-10 19:26
00'39''

一探上海两会|上海市政协委员黄海清:中国大模型公司要团结一起 开发自己的技术框架标准 不能跟着西方的“transfomer”跑

在全球大模型竞争进入深水区、Transformer架构主导行业发展的当下,中国大模型产业虽在应用层面快速迭代,但核心技术架构仍未脱离美国主导的现有框架。今年的上海两会期间,上海市政协委员、上海熠知电子科技有限公司董事长黄海清,呼吁国内大模型企业团结协作,在多模态大模型、行业垂类大模型等新兴赛道,率先打造自主技术架构与标准体系。

6 108 02-05 14:29
05'17''

瑞银:中国AI无需担忧泡沫 2026年性价比优势进一步凸显

AI热潮席卷全球,那么中国的AI产业是否存在泡沫?瑞银在近期接受第一财经采访中明确表示,当前中国AI发展仍处于早期健康阶段,无需过度担忧泡沫风险。与美国相比,中国以更低的投入实现了可观的模型进步。

7 67 01-19 18:06
03'45''

人形机器人何时真正打开消费市场?瑞银:技术突破是关键

2025年起,人形机器人成为A股市场一个众生所知的热门话题,相关概念股持续火热,企业商业化落地进程正在加速。那么人形机器人什么时候才能真正打开消费市场?为此,瑞银在接受第一财经采访时认为,人形机器人降低成本、打开市场的关键不在规模效应、而在技术突破,尤其是“大脑”部分专用AI模型的成熟;而工业侧通用性较低的相关场景或将率先实现规模化落地。

76 01-16 16:33
00'23''

张驰:特斯拉布局人形机器人 2026年或将启动百万级量产

5 26 01-13 18:04
一财最热
点击关闭