AIGC動態歡迎閱讀
原標題:Stable Diffusion 3論文終于發布,架構細節大揭秘,對復現Sora有幫助?
關鍵字:模型,文本,圖像,作者,性能
文章來源:機器之心
內容字數:5724字
內容摘要:
機器之心報道
編輯:張倩在眾多前沿成果都不再透露技術細節之際,Stable Diffusion 3 論文的發布顯得相當珍貴。Stable Diffusion 3 的論文終于來了!
這個模型于兩周前發布,采用了與 Sora 相同的 DiT(Diffusion Transformer)架構,一經發布就引起了不小的轟動。
與之前的版本相比,Stable Diffusion 3 生成的圖在質量上實現了很大改進,支持多主題提示,文字書寫效果也更好了(明顯不再亂碼)。Stability AI 表示,Stable Diffusion 3 是一個模型系列,參數量從 800M 到 8B 不等。這個參數量意味著,它可以在很多便攜式設備上直接跑,大大降低了 AI 大模型的使用門檻。
在最新發布的論文中,Stability AI 表示,在基于人類偏好的評估中,Stable Diffusion 3 優于當前最先進的文本到圖像生成系統,如 DALL?E 3、Midjourney v6 和 Ideogram v1。不久之后,他們將公開該研究的實驗數據、代碼和模型權重。在論文中,Stability AI 透露了關于
原文鏈接:Stable Diffusion 3論文終于發布,架構細節大揭秘,對復現Sora有幫助?
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...