大模型集体失智！和哪个大几乎全翻车了

大模型集体失智！和哪个大，几乎全翻车了

没眼看……“9.11和9.9哪个大”这样简单的问题，居然把主流大模型都难倒了？？强如GPT-4o，都坚定地认为9.11更大。谷歌GeminiAdvanced付费版，同样的口径。新王Claude3.5Sonnet，还一本正经的给出离谱的计算方法。9.11=9 1/10 1/1009.9=9 9/10到这一步还是对的，但下一步突然就不讲道理了如上所示，9.11比9.90大0.01。你想让我进一步详细解释小数的比较吗？这你还解释啥啊解释，简直要怀疑是全世界AI联合起来欺骗人类了。艾伦AI研究所成员林禹臣换了个数字测试，G...

科技资讯 2024-07-16 634 0 大模型集体失智！和哪个大几乎全翻车了

1