分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

2025/03/04

11:44【豆包大模型团队开源基准测试集SuperGPQA】据豆包大模型团队官微消息,近日,豆包大模型团队开源SuperGPQA,一个领域全面且具备高区分度的知识推理基准测试。据介绍,该数据集构建了覆盖285个研究生级学科、包含26529道专业问题的评估体系,不仅涵盖主流学科,更将轻工业、农业、服务科学等长尾学科纳入其中,展现出全面学科的覆盖广度,填补了长尾知识评估领域的空白。

举报
点击关闭