AIGC動態歡迎閱讀
原標題:從零開始,用英偉達T4、A10訓練小型文生視頻模型,幾小時搞定
關鍵字:數據,模型,圖像,視頻,生成器
文章來源:機器之心
內容字數:0字
內容摘要:
選自 levelup.gitconnected
作者:Fareed Khan
機器之心編譯
編輯:杜偉、大盤雞很翔實的一篇教程。OpenAI 的 Sora、Stability AI 的 Stable Video Diffusion 以及許多其他已經發布或未來將出現的文本生成視頻模型,是繼大語言模型 (LLM) 之后 2024 年最流行的 AI 趨勢之一。
在這篇博客中,作者將展示如何將從頭開始構建一個小規模的文本生成視頻模型,涵蓋了從理解理論概念、到編寫整個架構再到生成最終結果的所有內容。
由于作者沒有大算力的 GPU,所以僅編寫了小規模架構。以下是在不同處理器上訓練模型所需時間的比較。作者表示,在 CPU 上運行顯然需要更長的時間來訓練模型。如果你需要快速測試代碼中的更改并查看結果,CPU 不是最佳選擇。因此建議使用 Colab 或 Kaggle 的 T4 GPU 進行更高效、更快速的訓練。
構建目標
我們采用了與傳統機器學習或深度學習模型類似的方法,即在數據集上進行訓練,然后在未見過數據上進行測試。在文本轉視頻的背景下,假設有一個包含 10 萬個狗撿球和貓追老鼠視頻的訓練數據集,然
原文鏈接:從零開始,用英偉達T4、A10訓練小型文生視頻模型,幾小時搞定
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...