分享到微信

打开微信，点击底部的“发现”，
使用“扫一扫”即可将网页分享至朋友圈。

2024/07/17

17:47【9.11比9.8大？大模型们为何会在小学数学题上集体翻车】最近，面对9.11和9.8哪个大的问题上，一波大模型集体翻车了。

7月17日，记者实测13个主流大模型，询问9.11和9.8的数字大小问题，其中阿里通义千问、百度文心一言、Minimax、腾讯元宝、科大讯飞星火、智谱清言和百川智能百小应答对，ChatGPT-4o、字节豆包、月之暗面kimi、零一万物万知、阶跃星辰跃问、商汤商量答错。

值得注意的是，根据媒体报道，智谱清言和百川智能百小应也曾经“翻车”过，不过截至发稿时已经“纠正”了相关错误。

“通俗而言，此次很多大模型会翻车的原因是因为大模型普遍采取文本模型，容易从文本角度去理解这些数字。”长期布局AI的A股上市公司昆仑万维CEO方汉告诉记者，“如果给出明确的限定词，告诉它们，9.8和9.11都是浮点数（实数），大模型就更容易理解这个问题的内涵。”（澎湃新闻）

分享到：

分享到微信

2024/07/17