AIGC動態歡迎閱讀
原標題:打臉奧特曼,GPT-4今年比去年還懶!網友在線實測出爐
關鍵字:網友,惰性,小費,發現,完成率
文章來源:量子位
內容字數:2352字
內容摘要:
克雷西 發自 凹非寺量子位 | 公眾號 QbitAIGPT-4變懶的問題,又有新進展。
就在今天凌晨,奧特曼發推稱,GPT-4這個毛病在新的一年應該好多了!
關于GPT-4變懶,網友的吐槽已是不計其數,其中最多的就是與代碼相關的任務:
完成度不高不說,還會被分割成一個一個小塊,使用時需要逐一復制。
對于最新版本,一位博主體驗之后表示,自己嘗試給一年級的孩子做了個學習用的小游戲,效果還不錯。
但也有人不認同,比如這位網友就發現,ChatGPT回復的長度雖然增加了,但是很多都是車轱轆話,干正事依舊擺爛。
他讓ChatGPT把一些文本翻譯成17種語言,結果嘰里呱啦說了一堆就是不翻譯。
為了消除個體差異,有網友用數據集測試了新的ChatGPT,結果……
新版反而更懶了?這位網友用GitHub上開源的一套“lazy benchmark”測試了0125(24年1月最新版)和1106(23年11月的上一版)GPT-4模型,發現新版甚至還不如以前,變得更懶了。
這個測試數據集包含了與代碼相關的任務,用正確完成的比例間接反應“懶惰”程度,完成率越高說明“惰性”越小。
結果,對于其中的代碼比較(Unifi
原文鏈接:打臉奧特曼,GPT-4今年比去年還懶!網友在線實測出爐
聯系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...