打开微信,点击底部的“发现”,使用“扫一扫”即可将网页分享至朋友圈。
第一财经 2024-08-14 09:34:24
作者:一财科技 责编:刘佳
{{aisd}}
AI生成 免责声明
OpenAI推出代码生成评估基准SWE-bench Verified。该公司在官网博客中提到:"随着我们的系统越来越接近 AGI,我们需要在越来越具有挑战性的任务中对它们进行评估"。这一基准是对现有SWE-bench的改进版本(子集),旨在更可靠地评估AI模型解决现实世界软件问题的能力。SWE-bench是一个软件工程评估套件,用于评估大型语言模型 (LLM) 解决从GitHub提取的真实软件问题的能力。
一财科技
除了在外部合作上出现争议,微软内部也在调整。
MiniMax发布新一代大模型M2.7;OpenAI推出GPT-5.4 mini与nano。
黄仁勋认为OpenClaw标志着软件架构的重塑。
甲骨文的财报就像是行业的一场压力测试
腾讯混元提出HY-WU,让模型实时生成参数“换脑”;大晓机器人开源以空间智能为基的通用技术底座。