GPT-4o不會數r，被外國小哥原地逼瘋！谷歌論文揭秘Transformer「數不到n」

AIGC動態1年前 (2024)發布新智元

AIGC動態歡迎閱讀

原標題：GPT-4o不會數r，被外國小哥原地逼瘋！谷歌論文揭秘Transformer「數不到n」
關鍵字：小哥,研究者,任務,詞表,模型
文章來源：新智元
內容字數：0字

內容摘要：

新智元報道編輯：Aeneas 好困
【新智元導讀】提示工程師Riley Goodside小哥，依然在用「Strawberry里有幾個r」折磨大模型們，GPT-4o在無限次PUA后，已經被原地逼瘋！相比之下，Claude堅決拒絕PUA，是個大聰明。而谷歌最近的論文也揭示了本質原因：LLM沒有足夠空間，來存儲計數向量。Strawberry里究竟有幾個r，如今已經成為測試模型能力的黃金標準之一了！
就在昨天，號稱世界最強模型Reflection 70B在證明自己的性能時，證據之一就是「反思微調」新算法能讓自己糾正對Strawberry難題的錯誤回答。
很多人說，現在很多大模型已經學會數strawberry中有幾個r了。
現實恐怕沒有這么理想。
還是Riley Goodside小哥，這次又發現，ChatGPT依然數不清Strawberry里有幾個r。
而且這一次，他給GPT-4o上的是極限難度。
Strawberry里有幾個r？GPT-4o回答說：2個。
小哥無情地駁回——錯誤。
GPT-4o立馬改正了自己的答案：只有1個r。
小哥依然打叉。
第三次，GPT-4o給出了正確答案——3個，但依

原文鏈接：GPT-4o不會數r，被外國小哥原地逼瘋！谷歌論文揭秘Transformer「數不到n」

聯系作者

文章來源：新智元
作者微信：
作者簡介：

閱讀原文

# AIGC動態 # 任務 # 小哥 # 模型 # 研究者 # 詞表

文章版權歸作者所有，未經允許請勿轉載。

暫無評論

暫無評論...

国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

GPT-4o不會數r，被外國小哥原地逼瘋！谷歌論文揭秘Transformer「數不到n」

AIGC動態歡迎閱讀

內容摘要：

聯系作者

GPT-4結合SAM2：免訓練多模態分割的全新解決方案！| 已開源

創業2年肝出爆款AI 工具！碾壓VS Code、讓OpenAI 員工都倒戈，開發者們集體上頭！

相關文章

暫無評論

ChatGPT

玩虛擬模特？

国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

GPT-4o不會數r，被外國小哥原地逼瘋！ 谷歌論文揭秘Transformer「數不到n」

AIGC動態歡迎閱讀

內容摘要：

聯系作者

GPT-4結合SAM2：免訓練多模態分割的全新解決方案！| 已開源

創業2年肝出爆款AI 工具！碾壓VS Code、讓OpenAI 員工都倒戈，開發者們集體上頭！

相關文章

暫無評論

ChatGPT

玩虛擬模特？

GPT-4o不會數r，被外國小哥原地逼瘋！谷歌論文揭秘Transformer「數不到n」