首页 > 新闻 > 资讯

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

赋能工程建设领域数智升级 上海建科咨询集团首发工程监理行业大模型测评集

第一财经 2026-01-18 18:52:34 听新闻

责编:江雪

本次大会汇聚行业领导、专家、各类获奖代表等核心力量,以展示优质成果为核心,凝聚行业高质量发展的共识。

2026年1月18日,由中国建设监理协会主办的工程监理行业成果发布大会(2025)在山东济南圆满落幕。本次大会汇聚行业领导、专家、各类获奖代表等核心力量,以展示优质成果为核心,凝聚行业高质量发展的共识。

会上,上海建科咨询集团党委副书记、总裁夏冰作了“盈科·绳墨”工程监理行业大模型测评集Norma-MESBench 1.0首次发布的主题报告,分享该测评集的研发理念与行业价值。

Norma-MESBench 1.0是上海建科咨询集团打造的国内首个监理行业万题规模的大语言模型测评基准——它填补了监理领域专属AI大模型测评基准的空白,能用科学、量化的方式帮企业判断AI大模型在监理各专业的知识掌握程度,既是上海建科咨询集团人工智能技术落地的关键成果,更是行业放心用AI、选对AI的实用指南。

该测评集项目从监理行业的角度拆分了含专业技术、通用综合、特色场景三大板块和多个层级的“全维度测评框架”,采用“人工+大模型辅助”的混合模式构建了超万条测评数据,再经格式标准化、去重算法和多轮人工复核等流程进行题目质量控制。为确保测评过程的便捷性、科学性与鲁棒性,项目采用了“多层级加权评分”“裁判模型评审组”等算法实现全流程自动化、标准化,为行业提供了统一、规范、可用的大模型监理专业能力测评框架。

该测评集目前完成了17款主流通用大模型在监理工作场景的能力测评和分析,为相关企业和从业人员提供了专业、精准的大模型在工程监理领域的能力评估,助力企业科学选择适用的AI大模型。

为构建开放和可持续的行业AI生态,上海建科咨询集团已将该项关键成果进行了开源发布,首发当日在modelscope下载量已突破了1800次。期待与更多企业和科研机构携手,进一步推动监理行业人工智能技术的健康、快速发展.

本次测评集不仅是工程监理行业大模型测评体系关键技术成果的首次发布,更是深化“人工智能+”战略在工程建设领域落地的关键一环。随着人工智能技术的广泛应用,工程监理行业将迎来更高质量、更可信赖的智能化转型新阶段。

举报
一财最热
点击关闭