大模型集体失智!和哪个大几乎全翻车了

  • 大模型集体失智!和哪个大,几乎全翻车了

    大模型集体失智!和哪个大,几乎全翻车了

    没眼看……“9.11和9.9哪个大”这样简单的问题,居然把主流大模型都难倒了??强如GPT-4o,都坚定地认为9.11更大。谷歌GeminiAdvanced付费版,同样的口径。新王Claude3.5Sonnet,还一本正经的给出离谱的计算方法。9.11=9 1/10 1/1009.9=9 9/10到这一步还是对的,但下一步突然就不讲道理了如上所示,9.11比9.90大0.01。你想让我进一步详细解释小数的比较吗?这你还解释啥啊解释,简直要怀疑是全世界AI联合起来欺骗人类了。艾伦AI研究所成员林禹臣换了个数字测试,G...

1

最近发表