AIGC動態歡迎閱讀
原標題:大模型瘋狂 Rush,上海 AI Lab 回歸語言建模本質
關鍵字:模型,能力,數據,人工智能,實驗室
文章來源:AI科技評論
內容字數:12928字
內容摘要:
做大模型,還是要回歸到難且價值大的事情上去。作者丨王 悅
編輯丨陳彩嫻
2023 年,是國內外大模型瘋狂 rush 的一年。
在這場白熱化的競爭中,大模型過剩帶來的市場擠壓感正時刻提醒著參與者所面臨的行業洗牌風險。各廠商深知,基礎通用大模型,注定是少數人的游戲。
為了贏得這場游戲,各家大模型多以一月四次的頻率飛速迭代自身產品。這么做的原因,無非是看中沖在前面的先發優勢——這可以在一定的商業周期中,與后來者拉開不小的距離。
加之數據上的“飛輪效應”,更早應用、更多用戶的大模型,具備更高的市場打開度。
誠然,更靠前的身位的確重要,但過度地重視速度,則容易忽略大模型落地所需要的長周期、重基建和工程化難度——底層基礎尚不堅固就匆匆在此基礎上搭建高樓,其效果往往是「基礎不牢,地動山搖」。
雖說如此做法也可以營造繁榮的表象,成功地將模型的成績在某些特定的方面提上來,且在評測榜單中處于一個比較不錯的位置,但其背后,則更多地依靠專項調優的方法,潛力十分有限。
經過市場的狂熱期,整個行業意識到,還是要更多地關注基礎能力是否真正取得了進步。
不同于商業化的大模型廠商,上海人工智能實驗室在這場角逐中則穩定地
原文鏈接:大模型瘋狂 Rush,上海 AI Lab 回歸語言建模本質
聯系作者
文章來源:AI科技評論
作者微信:aitechtalk
作者簡介:雷峰網旗下AI新媒體。聚焦AI前沿研究,關注AI工程落地。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...