李沐交大演講全文：創(chuàng)業(yè)的動機要么來自欲望，要么來自恐懼

AIGC動態(tài)1年前 (2024)發(fā)布 Founder Park

AIGC動態(tài)歡迎閱讀

原標題：李沐交大演講全文：創(chuàng)業(yè)的動機要么來自欲望，要么來自恐懼
關鍵字：模型,數(shù)據(jù),解讀,問題,算法
文章來源：Founder Park
內(nèi)容字數(shù)：0字

內(nèi)容摘要：

AI大神李沐在母校上海交大的演講火了。
在這場一個半小時的演講里，李沐從大模型的算力和技術、多模態(tài)趨勢、應用現(xiàn)狀聊到了自己的AI創(chuàng)業(yè)心得、以及創(chuàng)業(yè)的痛苦和感悟。
可以說，比他那篇創(chuàng)業(yè)回顧（《李沐：創(chuàng)業(yè)一年，人間三年》）信息量更大。
一些有意思的點：
機器學習是老中醫(yī)，深度學習特別是大語言模型像煉丹，數(shù)據(jù)是煉丹的材料，算力是煉丹的火力和設備，算法就是丹方了。丹方每年都在進步，即使丹方一樣，細節(jié)不一樣結果也會很不一樣。
內(nèi)存是目前模型尺寸的一大瓶頸，英偉達雖然是領先者，但在這塊的技術不如AMD和TPU。
語言模型參數(shù)規(guī)模的主流會在100B-500B之間，比較好的一線的模型就是 500B，超過 500B 不是訓練不動，而是做 serving 很難。在谷歌歷史上，他們就沒有讓 500B 以上的模型上過線。
音樂模型的制約不是技術問題，而是商業(yè)問題，實際還是版權的問題。
語言模型已經(jīng)達到了較高的水平，大約在 80 到 85 分之間。音頻模型在可接受的水平，處于能用階段，大約在 70-80 分之間。但在視頻生成方面，尤其是生成具有特定功能的視頻尚顯不足，整體水平大約在 50 分左右。
對于文科白領

原文鏈接：李沐交大演講全文：創(chuàng)業(yè)的動機要么來自欲望，要么來自恐懼