打臉奧特曼，GPT-4今年比去年還懶！網友在線實測出爐

AIGC動態2年前 (2024)發布量子位

AIGC動態歡迎閱讀

原標題：打臉奧特曼，GPT-4今年比去年還懶！網友在線實測出爐
關鍵字：網友,惰性,小費,發現,完成率
文章來源：量子位
內容字數：2352字

內容摘要：

克雷西發自凹非寺量子位 | 公眾號 QbitAIGPT-4變懶的問題，又有新進展。
就在今天凌晨，奧特曼發推稱，GPT-4這個毛病在新的一年應該好多了！
關于GPT-4變懶，網友的吐槽已是不計其數，其中最多的就是與代碼相關的任務：
完成度不高不說，還會被分割成一個一個小塊，使用時需要逐一復制。
對于最新版本，一位博主體驗之后表示，自己嘗試給一年級的孩子做了個學習用的小游戲，效果還不錯。
但也有人不認同，比如這位網友就發現，ChatGPT回復的長度雖然增加了，但是很多都是車轱轆話，干正事依舊擺爛。
他讓ChatGPT把一些文本翻譯成17種語言，結果嘰里呱啦說了一堆就是不翻譯。
為了消除個體差異，有網友用數據集測試了新的ChatGPT，結果……
新版反而更懶了？這位網友用GitHub上開源的一套“lazy benchmark”測試了0125（24年1月最新版）和1106（23年11月的上一版）GPT-4模型，發現新版甚至還不如以前，變得更懶了。
這個測試數據集包含了與代碼相關的任務，用正確完成的比例間接反應“懶惰”程度，完成率越高說明“惰性”越小。
結果，對于其中的代碼比較（Unifi

原文鏈接：打臉奧特曼，GPT-4今年比去年還懶！網友在線實測出爐