首页 > 新闻 > 科技

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

新华社研究院:商汤“商量”获评中国大模型市场未来领袖

2023-11-28 18:41:58 听新闻

责编:陈婷

近日,新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告3.0》报告,对主流大模型进行了全面的评估,并为中国企业的大模型产品选型提供了专业指导。报告显示,商汤商量SenseChat在定量实测的情商维度上,位居全部10款大模型第一,并在定性评估中入选大模型市场未来领袖象限。此外,商汤赋能电力AI平台智能化升级的实践,也入围此次新华社研究院报告的“厂商最佳实践案例”。

新华社研究院:商量SenseChat情商表现第一,中国大模型市场的“未来领袖”

新华社研究院测评选取了10家国产主流大模型产品,进行了深入的定量实测,覆盖基础能力、智商、情商和工作提效四个维度的1000道题,并精选其中的400道进行实际问答测试,准确地反映大模型在不同场景和问题下的实际表现。

实测中,商汤商量取得1746分的优异结果,其中情商维度表现位居10家主流大模型第一。分析显示,在智商指数方面,商汤商量能够根据指令回答问题;在情商指数方面,能够给出方案详尽,问题切入角度多样,且能够引发用户进行深入思考的答复。

而在工作提效方面,商汤商量不仅能够较好地解答日常疑惑,在法学、经济学、文学方向上也表现不凡,能够以较快的速度响应并给出准确可信的结果。

同时此次评测升级了评测体系,首次纳入象限评估模式,从“技术实力”和“发展潜力”两个维度进行详细的定性分析,并选入未来领袖、技术为王、潜力无限和中规中矩四个象限,体现大模型在技术和市场方面的综合实力。商汤商量也凭借在“技术实力”和“发展潜力”不俗的表现,在众多大模型中脱颖而出,被新华社研究院认可为中国大模型市场的“未来领袖”。

厂商最佳实践案例:商汤商量助力能源电力企业升级AI平台

随着大模型能力提升,以及应用场景的逐步丰富。新华社研究院报告指出,以商汤商量为代表,大模型已经覆盖了职场、营销、出行、生活、公文、客服等多个行业和场景。同时,大模型的产业价值也受到了越来越多的关注。如何将大模型与产业深度融合,通过提升生产效率、优化决策和管理、创新业务模式等,推动社会经济的发展和进步,成为了大模型厂商更为重要的课题。

在新华社研究院报告的“厂商最佳实践案例”部分,商汤与电力企业共同探索大模型技术与新型电力系统的创新结合,并在电力生产和运维领域应用大模型技术,实现了降本增效,助力电力企业AI平台的智能化升级。

这个案例中,某国有电力企业希望借助大模型能力,为庞大规模用户提供高质量服务。同时在电网自动化巡检、电力调度等领域,也面临着智能化能力构建和提升的迫切需求。面对这一需求,以商汤大模型体系为核心,双方共同探索电力人工智能平台建设,优先解决在运维场景对长尾故障和缺陷进行智能识别和判断的问题。根据规划,未来双方将共同推动电力行业AI大模型训练与应用、算力建设、标准建设、产业转化和市场拓展,加快推动电力行业的人工智能创新及应用。

据统计,目前商汤商量在金融、手机、医疗、汽车、地产、能源、传媒、工业制造等众多垂直行业,已经与超过500家客户建立了深度合作,和行业企业一起探索大模型的产业落地,加速赋能企业的智能化转型。新华社研究院报告也认为,随着大模型快速的升级迭代,大模型的技术能力开始越来越多地体现在产品能力上,大模型将会推动数字经济和产业经济的深度融合,掀起一轮技术革命,为社会经济发展提供源源不断的科技动力。

领先基础设施和研发体系,巩固商汤大模型竞争力

事实上商汤商量今年4月正式推出,是国内最早推出的基于千亿参数大语言模型的产品之一,并一直不断迭代更新。在今年9月SuperCLUE的评测中,商汤商量位列中文大模型总榜及AI智能体子榜双榜排名第一,展示了在大模型方面极强的综合竞争力。

这些离不开商汤对人工智能基础设施的前瞻性打造以及围绕大模型及研发体系的规模化投入。商汤以SenseCore商汤AI大装置为基础,建立了一套工程化的体系来支撑大模型的快速迭代,软件、系统和硬件都在以服务大模型快速迭代为目标做研发配合,实现了敏捷、低成本、大批次地做模型迭代,有助于商汤发现大模型最好、最有效的生产配方。

其中商汤上海临港AIDC是目前全国规模最大的人工智能智算中心之一,截至2023年8月底已上架的GPU数量达到约3万张。而在对大模型的迭代训练过程中,商汤也积累了稀缺的算法和工程上的专业知识,以及改进数据管理的方法。商汤通过人工和算法结合的方式,对原始语料数据来做分门别类的精细化清洗,目前已经实现每月产出2万亿token的高质量训练数据,预计在2023年底,可以突破10万亿token。

借助这些丰厚、领先的算力和数据资源,商汤不断优化迭代大模型能力,同时创造领先的大模型落地和生成式AI应用生态,通过帮助客户打造行业大模型和更多的领域应用,推动更多产业的智能化升级。

举报
相关阅读

名校“海归”投奔,新质生产力就业热度爆表

新质生产力对于企业和人才具有同样的高要求、高标准。

02-25 22:15

用户需要怎样的行业大模型?︱AI大模型十问(六)

编者按:ChatGPT爆火后,AI大模型层出不穷,面向行业的垂直大模型也陆续发布。那么,怎么才算一个合格的行业大模型?行业数据哪里来?如何将行业know how更好地融入大模型?第一财经推出“十问AI大模型”专题,进一步追问与解密。

01-30 15:28

行业大模型如何拥抱应用场景?︱AI大模型十问(四)

编者按:ChatGPT爆火后,AI大模型层出不穷,面向行业的垂直大模型也陆续发布。那么,怎么才算一个合格的行业大模型?行业数据哪里来?如何将行业know how更好地融入大模型?第一财经推出“十问AI大模型”专题,进一步追问与解密。

01-23 11:15

书生·浦语2.0正式开源,回归语言建模本质,综合性能领先开源社区

1月17日,书生·浦语2.0(InternLM2)发布会暨书生·浦源大模型挑战赛启动仪式在上海举行。

01-18 14:15

2023国内大模型发展情况盘点(二)--中美大模型情况发展比较

截止2023年5月,中国已成功发布超过79个拥有10亿以上参数的基础大语言模型,相同等级模型下,美国发布数量达到100个。全球范围内累计推出的10亿以上参数大语言模型总数为202个,其中中美两国所发布的模型总数占比近90%。相关数据体现国内于大型语言模型开发领域已跻身领先行列,本文将通过中美大型语言模型发展比较深入了解发展现状。

01-14 23:06
一财最热
点击关闭