AIGC動態歡迎閱讀
原標題:今日arXiv最熱大模型論文:何愷明重提十年之爭——模型表現好是源于能力提升還是捕獲數據集偏見
關鍵字:數據,偏差,模型,任務,神經網絡
文章來源:夕小瑤科技說
內容字數:9539字
內容摘要:
夕小瑤科技說 原創作者 | 松果2011年,知名學者Antonio Torralba和Alyosha Efros提出了“數據集偏差之戰”,他們發現機器學習模型很容易“過擬合”到特定的數據集上,導致在其他數據集上表現不佳。過去十年,隨著深度學習的到來,建立多樣化、大規模、全面且盡可能無偏的數據集一直是推動這場的引擎。
與此同時,算法的進步,特別是神經網絡架構的進步,已經在發現數據中的概念、抽象和模式——包括偏見——方面取得了前所未有的能力。
所以,為了研究此問題,何愷明團隊設計了一個虛構的”數據集分類”任務。在本篇論文中,研究者們在十年的戰斗之后重新審視了數據集偏差問題。本研究基于一個被稱之為數據集分類的虛構任務(例如其中一個研究的典型組合被稱為“YCD”,呈現了一個三向數據集分類問題),由構建更少偏見的數據集與開發更強大的模型之間的張力驅動。
令研究者和許多最初讀者驚訝的是,現代神經網絡在這樣的數據集分類任務上可以取得極高的準確率,且這一觀察結果非常穩健。進一步的實驗表明,通過分類數據集學到的表示攜帶了一些可轉移到圖像分類任務的語義信息。
總之,報告顯示,現代神經網絡驚人地有能
原文鏈接:今日arXiv最熱大模型論文:何愷明重提十年之爭——模型表現好是源于能力提升還是捕獲數據集偏見
聯系作者
文章來源:夕小瑤科技說
作者微信:xixiaoyaoQAQ
作者簡介:更快的AI前沿,更深的行業洞見。聚集25萬AI一線開發者、互聯網中高管和機構投資人。一線作者來自清北、國內外頂級AI實驗室和大廠,兼備行業嗅覺與報道深度。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...