据中国信通院官方公众号,国际电信联盟电信标准分局(ITU-T)于2025年3月正式发布ITU-T F.748.44 基础模型的评估标准:基准测试/ Assessment criteria for foundation models: Benchmark。该项国际标准由中国信息通信研究院牵头制定,规范了大模型基准测试的指标要求和测试方法。该标准旨在推动大模型基准测试体系架构形成国际共识,为大模型技术提供方和应用方提供高质量的能力评估依据,引导大模型技术及产业健康有序发展。
360集团创始人周鸿祎表示,当前人工智能发展已经进入下半场,智能体成为主角。智能体技术正推动人工智能从“会说话”向“能干活”跨越。
原因包括:数据基础薄弱、高成本与低ROI预期、场景复杂性与信任壁垒。
当前,AI制药行业一级市场的投融资开始复苏,DeepSeek的爆火又为行业带来新一轮机遇。
①国产具身大模型首次获得汽车制造全场景验证;②2025全球人工智能技术大会在杭举办;③广西在AI技术研发与应用领域获重要突破。
作为新一轮技术革命的底层构造,大模型已经在诸多领域自证价值。但对于医院场景来说,大模型能在哪些关键环节提供帮助,能帮助到何种程度,仍然是一个未解的命题。