哲學(xué)家萬(wàn)字解析Sora本質(zhì),楊立昆點(diǎn)贊轉(zhuǎn)發(fā),AI視頻離世界模擬器還有多遠(yuǎn)?
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:哲學(xué)家萬(wàn)字解析Sora本質(zhì),楊立昆點(diǎn)贊轉(zhuǎn)發(fā),AI視頻離世界模擬器還有多遠(yuǎn)?
關(guān)鍵字:報(bào)告,模型,物理,世界,視頻
文章來(lái)源:智東西
內(nèi)容字?jǐn)?shù):21228字
內(nèi)容摘要:
Sora是世界模擬器嗎?萬(wàn)字長(zhǎng)文深度解讀,楊立昆點(diǎn)贊。
編譯|香草
編輯|李水青
智東西3月8日?qǐng)?bào)道,近日,深度學(xué)習(xí)三巨頭之一、Meta首席科學(xué)家楊立昆點(diǎn)贊分享了一篇萬(wàn)字博文《視頻生成器是世界模擬器嗎?(Are Video Generation Models World Simulators?)》。
▲楊立昆在X平臺(tái)上轉(zhuǎn)發(fā)并稱這是一篇好文章
文章從Sora的工作原理、模擬假說(shuō)、直觀物理學(xué)、世界模型的定義、圖像生成等角度,深入探討了標(biāo)題所提出的問(wèn)題,并得出結(jié)論:像Sora這樣的視頻生成器,可能不是人們想象中的“世界模擬器”,但從更寬泛的定義上來(lái)看,它們可以被視作有限的“世界模型”。
本文作者以文生圖模型為例證,論述了Sora可能和Stable Diffusion類似,生成過(guò)程超出了對(duì)像素空間表面統(tǒng)計(jì)的擬合,可能受到3D幾何和動(dòng)態(tài)關(guān)鍵方面的潛在表示的影響,從而學(xué)到有用的深度、因果等特征的抽象表征。換句話說(shuō),Sora能在潛在空間中學(xué)習(xí)抽象規(guī)律,具有部分模擬世界的能力。
自Sora于今年初發(fā)布以來(lái),“Sora是否理解物理世界”話題引來(lái)眾多大佬下場(chǎng)討論。其中英偉達(dá)的科學(xué)家Jim Fan將Sora
原文鏈接:哲學(xué)家萬(wàn)字解析Sora本質(zhì),楊立昆點(diǎn)贊轉(zhuǎn)發(fā),AI視頻離世界模擬器還有多遠(yuǎn)?
聯(lián)系作者
文章來(lái)源:智東西
作者微信:zhidxcom
作者簡(jiǎn)介:智能產(chǎn)業(yè)新媒體!智東西專注報(bào)道人工智能主導(dǎo)的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來(lái)的千行百業(yè)產(chǎn)業(yè)升級(jí)。聚焦智能變革,服務(wù)產(chǎn)業(yè)升級(jí)。