李沐交大演講全文:創(chuàng)業(yè)的動機要么來自欲望,要么來自恐懼

AIGC動態(tài)歡迎閱讀
原標題:李沐交大演講全文:創(chuàng)業(yè)的動機要么來自欲望,要么來自恐懼
關鍵字:模型,數(shù)據(jù),解讀,問題,算法
文章來源:Founder Park
內(nèi)容字數(shù):0字
內(nèi)容摘要:
AI大神李沐在母校上海交大的演講火了。
在這場一個半小時的演講里,李沐從大模型的算力和技術、多模態(tài)趨勢、應用現(xiàn)狀聊到了自己的AI創(chuàng)業(yè)心得、以及創(chuàng)業(yè)的痛苦和感悟。
可以說,比他那篇創(chuàng)業(yè)回顧(《李沐:創(chuàng)業(yè)一年,人間三年》)信息量更大。
一些有意思的點:
機器學習是老中醫(yī),深度學習特別是大語言模型像煉丹,數(shù)據(jù)是煉丹的材料,算力是煉丹的火力和設備,算法就是丹方了。丹方每年都在進步,即使丹方一樣,細節(jié)不一樣結果也會很不一樣。
內(nèi)存是目前模型尺寸的一大瓶頸,英偉達雖然是領先者,但在這塊的技術不如AMD和TPU。
語言模型參數(shù)規(guī)模的主流會在100B-500B之間,比較好的一線的模型就是 500B,超過 500B 不是訓練不動,而是做 serving 很難。在谷歌歷史上,他們就沒有讓 500B 以上的模型上過線。
音樂模型的制約不是技術問題,而是商業(yè)問題,實際還是版權的問題。
語言模型已經(jīng)達到了較高的水平,大約在 80 到 85 分之間。音頻模型在可接受的水平,處于能用階段,大約在 70-80 分之間。但在視頻生成方面,尤其是生成具有特定功能的視頻尚顯不足,整體水平大約在 50 分左右。
對于文科白領
原文鏈接:李沐交大演講全文:創(chuàng)業(yè)的動機要么來自欲望,要么來自恐懼
聯(lián)系作者
文章來源:Founder Park
作者微信:
作者簡介:

粵公網(wǎng)安備 44011502001135號